Проекты*

Сравнение методов аппроксимации данных путём минимизации функций невязки различных видов

Работа призера открытой городской научно-практической конференции «Инженеры будущего» в секции «Информационные технологии, программирование, прикладная математика, социальный инжиниринг» среди работ учащихся 10−11 классов

Направление работы: Программирование, Информатика
Авторы работы: ГБОУ Школа № 1501
Предметы: Математика, Информатика
Классы: 10 класс
Мероприятия: Открытая городская научно-практическая конференция «Инженеры будущего» 2020 года

Актуальность

В современном мире статистика и анализ данных играют значительную роль. Потребность математически описать набор данных любой природы — от экспериментально полученных измерений при проведении школьной лабораторной работы по физике до задач синтеза речи, машинного обучения, нейронных сетей и искусственного интеллекта, обработки фото - и видеоматериалов, предугадывания компьютером возможного поведения человека — универсальна и может быть применена в различных областях исследовательской деятельности. Этими вопросами занимается регрессионный анализ — раздел математики, содержащий и изучающий набор статистических методов, позволяющих исследовать зависимость одной переменной от других.

Цель

Цель работы заключается в сравнении методов аппроксимации (упрощения) данных различными путями.

Задачи

1. Вывод формул.

2. Изучение различных методов аппроксимации данных.

3. Выбор языка программирования.

4. Написание программы с дружелюбным к пользователю интерфейсом и наглядная визуализация различных методов.

Оснащение и оборудование, использованное при создании работы

Персональный компьютер, система программных средств, используемая программистами для разработки программного обеспечения

Описание

В ходе работы над теоретической частью проекта был изучен метод наименьших квадратов, самостоятельно выведены формулы для коэффициентов аппроксимирующих функций в различных случаях.

По литературным источникам был изучен и реализован эффективный алгоритм аппроксимации функций путем минимизации суммы модулей отклонений. Создано программное приложение, позволяющее получить нужную аппроксимирующую функции (одного или двух переменных) в виде формулы, построить её график (соответственно, линию или поверхность), визуально оценить качество аппроксимации.

Результаты работы / выводы

Метод наименьших модулей имеет максимум функции правдоподобия, если ошибки измерения подчиняются закону Лапласа, в то время как метод наименьших квадратов — если ошибки распределены по Гауссу. Визуальное сравнение результатов работы методов наименьших квадратов и наименьших модулей позволяет предположить, что в большинстве случаев кривая, построенная методом наименьших модулей, аккуратнее описывает видимое расположение точек, «игнорируя» те, что зрительно и вправду воспринимаются как случайное отклонение от общей тенденции.

Перспективы использования результатов работы

Результаты можно внедрять в учебный процесс для освещения альтернатив известных и изученных методов описания данных.

Мнение автора

Работа выполнена на школьном уровне. Получен широкий пласт пожеланий доработок, которые будут выполнены автором. Мнение о проекте «Инженерный класс в московской школе» и конференции «Инженеры будущего» более чем позитивное. Все потребности и пожелания автора удовлетворены в полном объеме, организаторские вопросы были решенына высшем уровне.