Проекты*

Исследование методов мультиклассификации клеток костного мозга

Работа призёров конкурса проектов и исследований «Инженеры будущего» открытой городской научно-практической конференции «Инженеры будущего» в секции «IT в медицине, биомедицинские технологии, медицинское приборостроение, бионика» среди работ учащихся 10–11 классов

Направление работы: Инженеры
Авторы работы: ГАОУ Школа № 548
Предметы: Биология, Информатика
Классы: 10 класс
Мероприятия: Конкурс проектов и исследований «Инженеры будущего» открытой городской научно-практической конференции «Инженеры будущего» 2021 года

Актуальность

Острый лейкоз – заболевание, в основе которого лежит образование клона злокачественных (бластных) клеток, имеющих общую клетку – предшественницу. В основу классификации острых лейкозов положены внешний вид, цитохимические, генетические и иммунофенотипические особенности бластных клеток.

Всемирная организация здравоохранения классифицирует острые лейкозы на несколько групп: острые миелоидные лейкозы и родственные им новообразования; Т-клеточные лимфобластные лейкозы, В-клеточные лимфобластные лейкозы, острые лейкозы неопределённого происхождения.

Применение компьютерных технологий в данной области позволяет увеличить скорость постановки диагноза и снизить трудоёмкость и зависимость от человеческого фактора вследствие применения количественных характеристик клеток.

Предобработка изображений необходима для улучшения качества полученного изображения. При предобработке изображения также проводится процедура сегментации клетки, которая направлена на выделение области ядра и цитоплазмы. Процедура описания позволяет получить характеристики выделенного ядра и по полученным данным провести классификацию (отнести объект к одному из классов).

Цель

Проведение исследований методов мультиклассификации клеток костного мозга.

Задачи

  1. Анализ методов классификации (метод опорных векторов, «случайный лес», нейронные сети).
  2. Разработка концептуальной модели системы.
  3. Формирование требований к экспериментальному исследованию.
  4. Разработка методики проведения эксперимента.
  5. Проведение экспериментального исследования.
  6. Анализ и предоставление полученных результатов экспериментальных исследований.

Оснащение и оборудование, использованное при создании работы

  • Микроскоп биологический Olympus BX-43 с камерой Imperx IPX-4M1ST-GCFB
  • Компьютер (Intel(R) Core(TM) i5-3450 CPU @ 3.10 GHz 3.10 GHz 4GB RAM) с установленным программным обеспечением (ОS GNU/Linux Ubuntu, С++, Python с библиотеками NumPy, SciPy, Pandas, SciKit-Learn)
  • Гематологические препараты крови доноров и костного мозга больных острым лимфобластным лейкозом

Описание

Этапы работы над проектом:

1.   Сбор материалов для проведения исследований.

2.   Проведение предварительных исследований для формирования стратегии проведения основных исследований.

3.   Проведение исследований.

4.   Анализ результатов.

5.   Формирование отчёта.

Результаты работы/выводы

Работа посвящена проведению исследований методов мультиклассификации клеток костного мозга. В работе проведено исследование методов мультиклассификации клеток костного мозга для диагностики острых лейкозов.

Для проведения исследований применялась программа, разработанная на дистрибутиве Linux Ubuntu 18.04, содержащем интерпретатор Python 3.6.9, что позволяет начать работу без дополнительных действий по установке программных пакетов, обеспечивающих интерпретирование и выполнение программ на Python.

Программный модуль имеет два основных режима работы: режим обучения и режим классификации. Первый предназначен для работы с исходной выборкой, настройкой параметров алгоритма, выбора метода и анализа процесса обучения. В режиме классификации настройка не предусмотрена, можно только использовать ранее обученный алгоритм.

Объекты-клетки, выбранные для эксперимента, не должны принадлежать обучающей выборке, так как в таком случае классификатор будет иметь доступ к уже верифицированной клетке, то есть будет обладать информацией о её классовой принадлежности. Таким образом, чистота эксперимента будет нарушена.

В соответствии с этим требованием объекты исследования были выбраны случайным образом из тестовой выборки в количестве 20 штук с учётом того, что должны присутствовать представители всех девяти классов. Была получена сравнительная таблица, в которой первый столбец соответствует спрогнозированным меткам, а второй соответствует верифицированным меткам.

Согласно сравнительной таблице, из 20 экспериментов 11 можно признать проведёнными с отрицательным результатом, в том смысле, что спрогнозированная метка не совпала с верифицированной. В 8 случаях из этих 11 клетки проклассифицированы как лимфобласты, хотя на самом деле ими не являются. Это согласуется с матрицей ошибок, в которой можно видеть, что в абсолютном смысле число клеток, проклассифицированных как лимфобласты, больше, чем количество всех остальных типов.

Задача мультиклассификации была сведена к бинарной классификации, которая выполнялась методом опорных векторов. Работа с программой осуществлялась по разработанной методике, обеспечивающей минимизацию ошибок ввода.

Экспериментально проверена адекватность предложенного метода. Получена точность классификации 87% на тестовом наборе данных.

Перспективы использования результатов работы

Исследование является предварительным. В дальнейшем планируется увеличить число классов клеток, объём выборок различных типов клеток и уточнить результаты классификации на более представительных данных.

Сотрудничество с вузом/учреждением при создании работы

НИЯУ МИФИ

Мнение автора о своей работе, проекте «Инженерный класс в московской школе», конференции «Инженеры будущего», пожелания

«Участие в работе над проектом помогло в реализации творческого потенциала, для нас этот проект является стартом в будущую научно-исследовательскую деятельность.

Выступление на открытой научно-практической конференции – отличный шанс получить бесценный опыт и понять качество представленного проекта»