Проекты*

Сервис для интеллектуального аннотирования (суммаризации) текста

Работа призёра открытой городской научно-практической конференции «Инженеры будущего» по направлению «Инженеры» в секции «Информационные технологии, программирование, прикладная математика, социальный инжиниринг» среди работ учащихся 10–11 классов

Направление работы: Инженерия
Авторы работы: ГБОУ Школа № 1542
Предметы: Информатика
Классы: 10 класс
Мероприятия: Открытая городская научно-практическая конференция «Инженеры будущего» по направлению «Инженеры» 2022 года

Актуальность

Поиск в интернете на данный момент является достаточно сложной задачей, поскольку мы сталкиваемся с большим потоком информации, которую необходимо анализировать. Идея проекта заключается в том, чтобы помочь людям быстро анализировать большое количество текстовой информации путём её интеллектуального аннотирования и визуализации. При разработке проекта было выявлено, что на российском рынке мало сайтов для суммаризации, работающих на русском языке. Тем самым, проект становится весьма актуальным в практическом плане.

Цель

Разработать сервис для интеллектуального аннотирования (суммаризации) текстов на русском языке.

Задачи

  1. Проанализировать современные математические и программные решения для создания приложения.
  2. Рассмотреть наиболее перспективные и современные технологии организации клиент-серверных приложений.
  3. Выбрать библиотеки и алгоритмы для реализации программного средства.
  4. Изучить дополнительные технологии.
  5. Проработать создание интерфейса.
  6. Разработать прототип минимального программного средства.
  7. Изучить дополнительные технологии.
  8. Определить перспективы развития данного проекта.

Оснащение и оборудование, использованное при создании работы

  • Компьютер

Описание

Изучены современные технологии. Создана логическая и функциональная модель сервиса, реализованная с помощью языков Python, Java, фреймворков Flask,Quasar. Далее проводились тестирование и отладка.

Принцип работы программы

Зайдя на сайт, пользователь видит окошко, в которое вводится исходный текст для анализа. Далее просто необходимо нажать кнопку «Суммаризация текста», и программа выведет сокращённый аннотированный текст, а также круговую диаграмму, которая будет показывать процентный вклад каждого пункта в содержание текста.

Результаты работы/выводы

В результате был создан сервис для интеллектуального аннотирования (суммаризации) текста.

Рассмотрим конкретный пример использования данного программного решения. В качестве примера возьмём из интернета новостную статью.

Рис. 1. Источник для анализа

Рис. 2. Результат работы программы

Вставим в специальное окошко исходный текст и нажмём кнопку «суммаризация текста».

Рис. 3. Результат работы программы

На выходе мы получаем данный текст в виде круговой диаграммы с описанием ключевых предложений (Рис. 3.) и их процентным вкладом в содержание текста. (Как на другом примере – см. Рис. 4.)

Рис. 4. Результат работы программы

Перспективы использования результатов работы

Одной из основных задач на будущее является расширение функционала сайта. Дополнением станет перефразирование текста. Также планируется добавление возможности автоподстройки под различные категории текстов, что позволит улучшить качество получаемого сокращённого текста.

Авторы уже выяснили, что большинство сайтов специализируются на одном языке, хотелось бы добавить локализацию для других языков. Это поможет сайту стать универсальнее и привлечёт больше пользователей.

Сотрудничество с вузом/учреждением при создании работы

«МИРЭА – Российский технологический университет»;

Детский технопарк «Альтаир»

Мнение автора

«Участие в Открытой городской научно-практической конференции «Инженеры будущего» позволяет школьникам получить экспертную оценку своих достижений. Это помогает им определить слабые места проектов и усовершенствовать их для дальнейшего продвижения»