Проекты

СПАРТС – Система персонального алгоритмического распознавания тегированных снимков

Работа призёра открытой городской научно-практической конференции «Курчатовский проект – от знаний к практике, от практики к результату» в секции «Идея»

Направление работы: Информатика
Авторы работы: ГБОУ Школа № 1532
Предметы: Информатика
Классы: 10 класс
Мероприятия: Открытая городская научно-практическая конференция «Курчатовский проект – от знаний к практике, от практики к результату» 2021 года

Актуальность

В современном обществе всё более возрастает интерес к прошлому. Знание родового прошлого помогает определить и осмыслить место своей семьи в российской и мировой истории.

Автор проекта поднимает вопрос составления и систематизации генеалогического древа с использованием цифровизации данных (старых семейных фотографий). Также автор создаёт собственный программный продукт – систему персонального алгоритмического распознавания тегированных снимков, что облегчает поиск фотографий нужного человека и насыщает сухие статистические данные новыми наглядными материалами. Проект может наглядно продемонстрировать, как современные технологии способны объединять поколения.

Цели

  1. Сохранение памяти о своих предках.
  2. Создание модели, на базе которой любой желающий может увековечить память о своей родословной.

Задачи

  1. Составление генеалогического древа автора проекта.
  2. Поиск и систематизация фотографий для создания генеалогического древа, их оцифровка.
  3. Создание и разработка программы распознавания лиц для максимально эффективного поиска нужной персоны среди большого ресурса фотоснимков.

Оснащение и оборудование, использованное при создании работы

  • Компьютер
  • Облачное хранилище
  • Программа

Описание

В самом начале работы над проектом автор исследовал программы, которые позволяют генерировать генеалогическое древо, предоставляя возможность дополнительно размещать фотографии, что очень важно. Но у всех этих программ по отдельности были свои существенные минусы, такие как платность, ограничение по количеству фотографий и т.д. Готового идеального решения не оказалось.

Комплексного желаемого эффекта удалось добиться набором следующих действий:

  1. сканирование фотографии или плёнки, преобразование её в цифровой вид; при необходимости обработка полученного фотоизображения в графическом редакторе
  2. размещение фотографии на компьютере и в облачном хранилище
  3. присвоение каждой фотографии специальных меток (тегов) и возможного описания
  4. предоставление доступа родственникам к архиву
  5. создание системы персонального алгоритмического распознавания тегированных снимков

При сборе информации для построения генеалогического древа и обработки большого количества фотографий появилась потребность в автоматизации процесса поиска. В связи с этим был разработан алгоритм на базе технологий Google Colaboratory.

Для программной реализации алгоритма был выбран язык Python.

В связи с тем, что оцифрованные изображения – это массивы цифровых данных, необходимо было изучить библиотеку NumPy, которая поддерживает многомерные массивы и матрицы, а также математические функции для операций с этими массивами.

Библиотека Face_recognition – это библиотека машинного обучения Python, которая использована для упрощения распознавания лиц. Она позволяет обнаруживать лица, превращать каждое обнаруженное лицо в уникальный код, который представляет лицо в виде матрицы, а затем сравнивать кодировки лиц, чтобы определить, являются ли они одним и тем же человеком.

Модуль OS из стандартной библиотеки языка программирования Python используется для работы с файловой системой хранилища фотографий.

Для работы с фотографиями используется Google Drive, где в определённом каталоге размещаются фотографии с лицами в хорошем качестве для обучения модели Face_recognition. В другой каталог помещаются фото для обработки алгоритмом СПАРТС и поиска заданных лиц обученной моделью машинного обучения.

Процесс распознавания и сравнения лиц находит необходимые лица на фотографиях из второго каталога Google Drive и перемещает фото в соответствующий каталог, что облегчает работу по составлению генеалогического древа. После получения результата фотографии могут быть перемещены в другое хранилище.

Ценность представленной программы заключается в высокой вероятности нахождения заданного человека в большом наборе фотографий.

Результаты работы/выводы

  1. Составлено генеалогическое древо.
  2. Отсканировано и преобразовано в цифровой вид более 3500 фотографий, что обеспечивает их надёжное хранение. Часть фотографий была обработана и восстановлена (производилось ретуширование).
  3. Создана удобная база, которой может пользоваться любой родственник, независимо оттого как близко или далеко он живёт. По базе фотографий осуществляется поиск – появилась возможность с лёгкостью найти интересующую фотографию. Каждый имеющий доступ может редактировать описание фотографии, добавлять новые снимки.
  4. Написана и апробирована программа по распознаванию лиц для составления генеалогического древа.

Таким образом, современные технологии позволяют объединять разные поколения на примере семьи автора проекта. Комплексный подход позволил добиться использования современных инструментов в оживлении семейной истории, сделать её более доступной и открытой.

Перспективы использования результатов работы

Расширение генеалогического древа за счёт видеофрагментов бесед с родственниками, мемуарных выдержек, аудиосопровождения (комментарии и воспоминания людей старшего поколения); совершенствование программы СПАРТС.

Мнение автора

«Работа позволит составить генеалогическое древо по фотографиям и поможет людям не терять память о своих предках. Считаю эту тему важной и актуальной»