Проекты

Генерация отзыва о вузе при помощи Telegram-бота

Работа призёра конкурса проектов и исследований «Инженеры будущего» открытой городской научно-практической конференции «Инженеры будущего» в секции «Информационные технологии, программирование, прикладная математика, социальный инжиниринг» среди работ учащихся 10–11 классов

Направление работы: Инженеры
Авторы работы: Университетский Лицей № 1523 предуниверситария НИЯУ МИФИ
Предметы: Информатика
Классы: 10 класс
Мероприятия: Конкурс проектов и исследований «Инженеры будущего» открытой городской научно-практической конференции «Инженеры будущего» 2021 года

Актуальность

В современном мире непрерывно растёт количество информации, что приводит к увеличению спроса на автоматические средства её обработки. Отзывы – это основополагающий фактор при выборе людьми чего-либо. Они важны для потенциальных клиентов, т.к. это поможет им сделать свой выбор с учетом реальных преимуществ и недостатков, в нашем случае, вуза.

Цель

Создание алгоритма обработки отзывов и другой важной информации о вузах и генерация собственного отзыва при помощи телеграмм-бота.

Задачи

  1. Реализовать алгоритм выбора, анализа и классификации информации.
  2. Использовать бот для удобного представления полученного результата.

Оснащение и оборудование, использованное при создании работы

  • Ноутбук с установленным ПО (Pyhton, PyCharm, Google Colaboratory)
  • Мобильный телефон на Android 8.0.0 для отладки приложения.

Описание

Проект реализован при помощи ресурсов Python – различные библиотеки и методы. Алгоритм по созданию и разработке приложения:

  1. Собрать данные о запрашиваемом объекте, то есть произвести парсинг сайтов, чтобы в дальнейшем предоставить желаемую информацию пользователю. Парсер – программа находит контент, потом структурирует и сохраняет полученную информацию, действуя по алгоритму:
  2. Получить URL страницы, с которой извлекаются данные. Скопировать или загрузить HTML-содержимое страниц
  3. Распарсить HTML-содержимое и получить необходимые данные. В ходе парсинга используются возможности автоматизации браузера, перемещений по сайту, такие как нажатие кнопок, вставка текста в строку ввода, переход на другие страницы сайта.
  4. Обработать данные, выделить ключевые слова или фразы (к примеру, исключить стоп-слова и предложения, не имеющие смысла).
  5. Провести анализ логичности полученной информации, выбрать наилучший контент.
  6. Реализовать генерацию собственного отзыва на основе собранных и структурированных данных.

В идеале необходимо обучить нейронную сеть на предварительно сформированном Data set (набор хорошо обработанных и структурированных данных). В данный момент используется другая система генерации текста вследствие нехватки, абсолютной неструктурированности, а также трудности обработки данных по вузам на сайте, а именно: собирается Data set из всех отзывов о вузе, предложения в нем классифицируются по темам, затем анализируются на информативность, выбираются наиболее подходящие. Полный отзыв включает в себя несколько предложений по каждой теме.

Всю необходимую полученную информацию необходимо передать telegram-боту для предоставления пользователю в удобном виде.

Структура работы бота

  1.  Запрос на старт
  2.  Выбор вуза
  3.  Выбор типа информации:
    • Общая
    • Проходные баллы, направления подготовки
    • Отзывы
  4. По темам (питание, общежитие, преподаватели, домашняя работа, дополнительные занятия)
    • Общий
    • Общежитие
    • Дни открытых дверей

Результаты работы/выводы

Работая над этим проектом, авторы узнали много нового, что может понадобиться как в будущем, так и сейчас. Принято решение продвигать проект и развивать возможности создаваемого бота, добавлять в него всё больше новых категорий для пользователей. Уже реализованы некоторые новые идеи. Например, добавление нового отзыва – очень полезная и удобная фишка бота, которая экономит время и ресурсы.

Перспективы использования результатов работы

В будущем, развивая этот проект, совершенствуя работу бота, авторы добавят новые возможности и разделы, к примеру, добавление собственного отзыва. Также можно добавлять функции не только для поступающих и выбирающих ВУЗ, но и непосредственно для студентов. Выводить, например, еженедельное расписание, время каникул, даты экзаменов на каждом курсе.

Сотрудничество с вузом/учреждением при создании работы

НИЯУ МИФИ

Мнение автора о своей работе, проекте «Инженерный класс в московской школе», конференции «Инженеры будущего», пожелания)

«Наше приложение уже сейчас способно помочь абитуриентам. Мы планируем дальше развивать функционал приложения. Можно усовершенствовать его больше, опираясь на мнение пользователей»