Проекты*

Классификация звёзд на языке программирования Python

Работа победителя конкурса проектов и исследований «Инженеры будущего» открытой городской научно-практической конференции «Инженеры будущего» в секции «Информационные технологии, программирование, прикладная математика, социальный инжиниринг»

Направление работы: Инженеры
Авторы работы: ГБОУ «Курчатовская школа»
Предметы: Информатика, Астрономия
Классы: 11 класс
Мероприятия: Конкурс проектов и исследований «Инженеры будущего» открытой городской научно-практической конференции «Инженеры будущего» 2021 года

Актуальность

Современные приборы позволяют человеку заглянуть в космос. Аппараты сканируют небо круглосуточно и радары фиксируют огромное количество небесных тел. Звёзды не стали исключением. Постоянно открываемые звезды необходимо фиксировать и классифицировать для составления карты неба и для наблюдения изменений на нём.

Цель

Создание предсказывающей модели, которая классифицирует звёзды по определённым параметрам, таким как: температура, светимость, радиус, абсолютная звёздная величина, цвет и спектральный класс.

Задачи

  1. Изучение классификации звёзд.
  2. Поиск набора данных для тренировки модели.
  3. Изучение предварительной обработки данных.
  4. Изучение методов обучения модели.
  5. Написание модели, тренировка модели.
  6. Оценка качества модели.

Оснащение и оборудование, использованное при создании работы

  • Персональный компьютер с установленным ПО (Python)
  • Бесплатный облачный сервис Google Colab
  • Kaggle – социальная сеть специалистов по обработке данных (dataset) и машинному обучению (machingLearning)

Описание

Автором была изучена теория: параметры, по которым классифицируются звёзды; методы машинного обучения и некоторые библиотеки для программирования на Python.

 

Затем на платформе Kaggle был найден набор данных, который представляет собой таблицу с параметрами 240 звёзд, разделённых на 5 типов: коричневый карлик, красный карлик, белый карлик, звезда главной последовательности, сверхгигант, гипергигант.

 

Далее автором на языке Python была написана программа, которая учится на части набора данных, а потом самостоятельно классифицирует оставшуюся часть набора и сравнивает своё предсказание с правильным ответом.

Результаты работы/выводы

Получена модель, которая даёт высокую точность предсказания при работе с выбранным набором данных. Это значит, что её можно использовать для классификации других звёзд, тип которых не указан в таблице.

Перспективы использования результатов работы

Классификатор может работать автономно, получая данные прямо со спутников, но тогда необходимо совершенствовать модель, чтобы она была способна обрабатывать сложные данные (в том числе изображения).

Сотрудничество с вузом/учреждением при создании работы

УИЛ ФБКАиС НИУ ВШЭ

Мнение автора

«Я благодарна за возможность участвовать в конференции «Инженеры будущего». Мне понравилось представлять свой проект здесь, это мотивирует заниматься созданием новых проектов»