Проекты*

Программа «Антиплагиат» с графическим интерфейсом для файлов .txt и текстов

Работа победителей открытой городской научно-практической конференции «Инженеры будущего» по направлению «Инженеры» в секции «Информационные технологии, программирование, прикладная математика, социальный инжиниринг» среди работ учащихся 7−9 классов

Направление работы: Программирование
Авторы работы: ГБОУ Школа № 1770
Предметы: Информатика
Классы: 9 класс
Мероприятия: Открытая городская научно-практическая конференция «Инженеры будущего» по направлению «Инженеры» 2022 года

Актуальность

В современном мире всё бо́льшие обороты набирает цифровизация пространства, таким образом возрастают объёмы информации, которые размещаются в интернет-пространстве.

Именно из-за широкого выбора ресурсов встаёт вопрос о плагиате материалов.

Вопрос наличия заимствований в текстах и программах остро стоит как в школе, так и в университете, да и в целом в научной среде. Например, в школе учитель может поручить подготовить рефераты по разным темам в одном классе, но общий пул тем для всех классов из параллели будет одинаков, поэтому необходимо отследить, насколько ответственно ученики подошли к выполнению поставленного задания, не списали ли друг у друга, этот же вопрос актуален и при выполнении лабораторных работ.

Цель

Создать компьютерную программу (приложение с графическим интерфейсом), в которой будет осуществляться проверка загруженных работ между собой на наличие заимствований.

Задачи

  1. Провести анализ систем плагиата, предназначенных для анализа текста.
  2. Провести анализ математических алгоритмов, позволяющих обнаружить заимствования.
  3. Выбрать подходящие методы для обнаружения плагиата.
  4. Реализовать компьютерную программу для поиска заимствований.
  5. Провести тестирование итоговой версии программы.

Оснащение и оборудование, использованное при создании работы

  • Компьютер

Описание

Для данной программы авторами были выбраны и реализованы в приложении следующие методы:

  1. алгоритм Вагнера-Фишера;
  2. расстояние Левенштейна;
  3. метод шинглов.

Для реализации программы было решено выбрать язык программирования Python, так как большое количество встроенных библиотек позволяет упростить работу. Решили применять возможности Numpy для упрощения работы с матричными операциями и Tkinter для реализации графического интерфейса.

С помощью метода title() был задан заголовок для приложения, а с помощью элемента Frame – параметры окна, Button применялся для создания кнопок.

Все алгоритмы были реализованы отдельными функциями и подключены к соответствующим кнопкам, после ввода текста и нажатия кнопки 1, 2 или 3 перед пользователем выводился результат, показывающий процент сходства между файлами. После проверки учителю/преподавателю рекомендуется ещё раз проверить работы в формате .txt и принять решение о наличии заимствований и мерах, которые следует применить, например, предложить переделать рефераты ученикам.

Результаты работы/выводы

  1. Создано приложение с графическим интерфейсом, позволяющее пользователю осуществлять попарное сравнение файлов и делать выводы о возможном наличии плагиата в тексте.
  2.  Изучены методы обнаружения плагиата.
  3. Встроены три метода проверки.
  4. Встроена возможность загрузки информации из файлов или ввода с клавиатуры.
  5. Создана возможность возвращения к стартовому меню.
  6. Реализовано оконное приложение, позволяющее осуществлять поиск заимствований в текстах.
  7. Результаты работы программы апробированы.

Перспективы использования результатов работы

В дальнейшем планируется реализовать возможность одновременной загрузки и проверки нескольких файлов.