Свёрточные нейронные сети для распознавания дорожных знаков

Работа призёра открытой городской научно-практической конференции «Инженеры будущего» в секции «Информационные технологии, программирование, прикладная математика, социальный инжиниринг» среди работ учащихся 10−11 классов

Направление работы: Искусственный интеллект

Авторы работы: ГБОУ Школа № 171

Email: Написать

Предметы: Информатика

Классы: 10 класс

Мероприятия: Открытая городская научно-практическая конференция «Инженеры будущего» 18−20 апреля 2019 года

Цель

Исследование возможности использования свёрточных нейронных сетей для распознавания дорожных знаков и создание программы по их распознаванию.

Задачи

Получение базы данных дорожных знаков, состоящей из фотографий дорожных знаков.
Изучение литературных источников по теории разработки свёрточных нейронных сетей.
Разработка архитектуры свёрточной нейронной сети.
Разработка обучающего нейронную сеть цикла.
Разработка цикла проверки корректности обученной нейронной сети.

Описание

Программа представляет собой 4 части: класс, интегрирующий изображение в нейронную сеть, класс нейронной сети, описывающий её архитектуру, а также цикл обучения и цикл валидации (проверки корректности распознавания) обученной нейронной сети.

Нейронная сеть состоит из 6 слоёв:

1. conv1 свёрточный слой с 3 входами (картинка на вход − rgb) и 16 каналами выходов и kernel size = 5 (размер квадратных матриц).

2. pool1 слой типа MaxPool, «объединяющий» пиксели, иначе – уплотнение карты признаков. Kernel size = 2, stride = 2 (сдвиг, избегающий пересечений).

3. conv2 – свёрточный слой с 16 входами (от предыдущего conv-слоя), 16 выходами (фильтрами) и аналогичной матрицей. 4−6. – fully connected слои – слои полносвязной сети.

Цель слоя – классификация, моделирует сложную нелинейную функцию, при оптимизации которой улучшается качество распознавания. При этом на последнем слое количество нейронов равно количеству классов дорожных знаков.

Обучение и валидация проводились на разных данных, что позволило объективно оценить результаты. В качестве метода минимизации ошибки используется метод градиентного спуска. Функция активации на слоях классификации – relu.

Результат

Результатом работы стала программа, которая определяет класс дорожного знака, изображённого на картинке, в основе которой лежит нейронная сеть. Хотя в силу несбалансированности данных имеет место переобучение нейронной сети на некоторых классах, где число вхождений картинок менее 200 и, как следствие, крайне низкая точность предсказания. Однако у классов, количество изображений которых более 200, наблюдается точность распознавания около 80 %, что является отличным результатом для такого набора данных. Таким образом, в ходе работы были получены и использованы знания о разработке свёрточных нейронных сетей. А также обучен образец свёрточной нейронной сети, распознающий знаки из тестового набора данных с точностью до 90 % и средней точностью 50 %.

Созданная нейронная сеть после доработки может быть использована для установки в автотранспорт. Важно отметить, что решённая задача является реальной и актуальной в области разработки автопилотируемого дорожного транспорта.

Оснащение и оборудование

Язык программирования Python 3.
Библиотеки для машинного обучения: PyTorch, Pandas, NumPy.

Перспективы использования результатов работы

В будущем возможно обучение на более совершенном наборе данных.
Также возможна разработка программного обеспечения, имеющего связь с видеокамерой, которое в реальном времени выводит на экран тип знака.

Особое мнение

«Цель работы является одной из актуальных в области машинного обучения. Планируется её дальнейшее развитие»