Статья
Борисов Дмитрий Александрович, кандидат экономических наук, эксперт Федеральной антимонопольной службы России по развитию конкуренции в здравоохранении и образованииПрименение искусственного интеллекта для выявления патологии в том числе у плода на ранних сроках беременности
04 Декабря 2024Выделить главное вкл выкл 130
В настоящее время искусственный интеллект (далее - ИИ) активно применятся в медицине, в том числе в радиологии, УЗИ для выявления патологии, например, у плода на ранних сроках беременности
Содержание
1. Преимущества искусственного интеллекта в радиологии
2. Пример разработки и обучения ML-модели для диагностики заболевания
3. Технические проблемы распознавания объектов в процессе использования компьютерного зрения
1. Преимущества искусственного интеллекта в радиологии
Искусственный интеллект позволяет:
1) описывать снимок за секунды (врачу требуется до 20 минут)
2) получить второе мнение для врачей рентгенолога, клинициста
3) разделить поток пациентов в соответствии с приоритетами
4) автоматизировать контроль качества медицинской услуги
ИИ обеспечивает точность системы в 95-98% случаев
В настоящее время на рынке существуют отечественные информационные системы, предлагающие готовые решения в данной области. Например, https://botkin.ai/. Данной системе выдано удостоверение Росздравнадзора о регистрации медицинского изделия
В системе используется искусственный интеллект для анализа медицинских изображений. Система обеспечивает качественный анализ, удаленное описание и маршрутизацию любых объемов исследований в автоматическом режиме, содержит 1 млн. исследований в своих датасетах
Система предлагает:
1) Проспективный анализ. Поддержка принятия врачебного решения в режиме реального времени (до 7 минут на одно исследование). Время обработки: до 6 минут на КТ-исследование, до 1 минуты на рентген, до 3 минут на маммограмму
2) Ретроспективный анализ. Автоматический пересмотр любых объемов медицинских изображений для дополнительного выявления патологий.
3) Второе мнение. Проведение исследований в соответствии с приказом 124н (обязательное двойное прочтение маммографических исследований) + дополнительный контроль с помощью искусственного интеллекта
2. Пример разработки и обучения ML-модели для диагностики заболевания
Для понимания процесса распознавания медицинских изображений рассмотрим информацию, приведенную в статье, которая посвящена процессу разработки и обучения ML-модели для диагностики заболевания плода Spina Bifida с помощью нейросети для выявления этой болезни на ранних сроках беременности
Источник: https://education.yandex.ru/journal/neuroset-dlya-meditsiny
Бывает так, что на этапе внутриутробного роста у ребенка не успевают полностью сформироваться некоторые части позвонков. В норме эти части защищают спинной мозг и нервы. Такая патология называется Spina Bifida (спина бифида), это орфанное заболевание: на одного ребенка с подобным диагнозом приходится около десяти тысяч здоровых детей.
Если вовремя поставить диагноз, у родителей будет возможность принять решение о внутриутробной операции и подготовиться к рождению особенного ребенка. Но только очень опытные и узкопрофильные УЗИ-специалисты могут увидеть нарушения уже в первом триместре.
По инициативе фонда «Спина Бифида» в Яндексе реализовали кросс-дисциплинарный проект Spina Bifida и создали алгоритм, который поможет диагностировать болезнь без вовлечения не всегда доступных высококлассных УЗИ-специалистов.
Данный проект объединяет искусственный интеллект, медицину и благотворительность. Решение данной прикладной задачи может положительно повлиять на популяризацию применения искусственного интеллекта в медицине.
Команда проекта. Ребята из Yandex Cloud вели проект и делали архитектуру, выпускники Школы анализа данных (ШАД) — ML-модели и интерфейс. Процесс разработки включал обучение, тестирование, пере- и дообучение нейросетей для выделения зоны интереса и классификации на корректность снимка и наличие патологии, разработку интерфейса для пользователей.
Нужно было придумать алгоритм, который сможет проанализировать УЗИ-снимки и определить наличие патологии у плода. Врачи из НМИЦ им. Кулакова предоставили материал для обучения ML-модели — 6 тысяч размеченных снимков. Еще они поэтапно рассказали, как сами выявляют патологию. На основе этого был подготовлен план разработки.
Первоначально были сформированы задачи проекта:
1. Создание архитектуры решения, структуры будущего продукта, которая нужна, чтобы у команды сформировалось четкое понимание того, каким должен получиться конечный продукт
2. Доразметка изображений. На данном этапе специалисты определяли на изображениях зону интереса, корректность, патологию. В основном этим занимались врачи
3. Унификация базы данных с изображениями. Все снимки, которые были в наличии, были объединены в единый датасет
4. Создание пайплайна для обучения моделей. На данном этапе специалисты прописали алгоритмы моделей и метрики качества. На основе метрик качества модель принимала решение о корректности изображений. Для этого использовали функцию F2-score
5. Тестирование гипотез в пайплайне. На данном этапе специалисты добавляли разные функции потерь и аугментации; гиперпараметры и так далее. Такое тестирование необходимо, чтобы увидеть в процессе разработки, чего не хватает программе, и доработать ее
6. Создание веб-интерфейса для врачей
Рассмотрим подробнее этапы обучения нейросети распознаванию патологии.
В результате были разработаны пять нейросетей: одна для выделения зоны интереса, две для оценки корректности и еще две для определения патологии. Основные структурные элементы программы представляют собой три последовательных блока. Эти блоки повторяют образ мыслей врачей и соответствуют трем этапам работы программы.
1. Поиск и обрезка зоны интереса. Сначала врач на снимке смотрит только на зону интереса: в данном случае это голова и часть позвоночника. Поэтому специалисты собрали модель выделения зоны интереса. Для этого был применен алгоритм решения задачи в машинном обучении Object Detection, который определяет, есть ли на изображении какой-то конкретный объект, а также ищет его границы на уровне пикселей.
2. Нейросеть определяет первичную корректность изображения. Потом врач проводит анализ того, насколько качественно на изображении представлены необходимые ему признаки: не мешает ли шум, контраст, твердые ткани и так далее. Поэтому в разработке для этого этапа была разарботана ML-модель, которая классифицирует изображение как корректное или некорректное.
3. Поиск патологии. Наконец, если изображение корректное, врач принимает решение о наличии патологии. Аналогичный этап в разработке — ML-модель, обучена классифицировать изображения на норму и патологию. Это тоже своего рода определение корректности изображения: если патология есть, нейросеть считает снимок «корректным».
Для обучения искусственного интеллекта (ИИ) 6 тысяч снимков очень мало. Поэтому была применена аугментация для расширения учебного материала. Сложно сказать, сколько точно изображений дала аугментация, потому что преобразования применяются многократно, последовательно и случайно. Потенциально это дает сотни тысяч вариаций картинок.
Аугментация данных — метод в медицинской визуализации, который помогает улучшить модели диагностики, которые используют изображения для выявления и распознавания заболеваний.
Так как большинство изображений корректные и нормальные, модель была склонна реже замечать патологию. Чтобы победить эту проблему, были применены специальные функции потерь — Focal Loss, Cross Entropy Loss с весами и так далее.
Врачи помогали проверять (валидировать) аугментированные снимки на предмет соответствия настоящим
Например, перекрасить снимок УЗИ из серого в любой цвет радуги — это тоже аугментация, но она скорее вредная, потому что зеленых УЗИ-снимков на практике не бывает. Так модель может выучить несвойственные реальности признаки.
Если говорить не об изменении цвета, а о более тонкой аугментации — например, понижении качества из библиотеки MONAI или накладывании различных шумов, то задача усложняется и для решения нужен специалист. Тут и помогали врачи. Они также тестировали программу.
В настоящее время решение находится в открытом доступе. Проект продолжает развиваться: следующим шагом станет сбор и обработка новых данных в НМИЦ им. Кулакова для дообучения модели и повышения ее эффективности. Источник: https://spinabifida.cloudtechport.com
3. Технические проблемы распознавания объектов в процессе использования компьютерного зрения
Данный раздел подготовлен на основе материала статьи, размещенной по адресу https://education.yandex.ru/journal/kak-raspoznat-rukopisnyi-tekst
Проблемы распознавания объектов в процессе использования компьютерного зрения рассмотрим на примере распознавания рукописного текста
Обучение нейронной сети распознаванию печатного текста является сложной техническо задачей. Буквы между собой неоднородны: они могут различаться по цвету, толщине и размеру, - модель должна учитывать все эти тонкости
При работе с рукописным текстом указанные сложности сохраняются и дополнительно появляются новые
1. Отсутствие единого образца. У всех людей разный почерк, а ещё он может меняться даже у одного и того же человека — например, в зависимости от настроения. Можно написать одну и ту же букву в одном слове по-разному — как прописную и как печатную, а можно сделать разные буквы очень похожими, например «и», «к», «н» и «п». Способов написать один символ в рукописном тексте гораздо больше, чем в печатном, и от этого сложность распознавания повышается
2. Написание букв в связке. В рукописном тексте символы соединяются между собой. Из-за этого их написание будет зависеть от стоящих рядом букв — и, следовательно, меняться от слова к слову. А сам текст при этом очень трудно разделить на отдельные символы, чтобы модель распознала каждый и потом соединила их в слова и предложения. Поэтому приходится обучать нейросеть распознаванию слов целиком с учетом контекста рядом стоящих символов
3. Визуальные помехи. Буквы могут быть перечеркнуты или написаны друг поверх друга, чернила могут оставить кляксы в тексте или выцвести со временем — и тогда даже носителю языка будет сложно распознать, что же написано
Современные ML-инженеры смогли преодолеть эти трудности и вывести качество распознавания рукописного текста при помощи нейросетей на довольно высокий уровень
В качестве примера приведем оцифровку архивов
В процессе генеалогических исследований приходится тратить много времени и сил на посещение архивов и работу с летописями
Чтобы облегчить изучение родословной, разработчики из OCR-службы Яндекса создали проект «Поиск по архивам» https://ya.ru/archive. При помощи компьютерного зрения для него было оцифровано более 15 млн. архивных документов. Именно по ним и осуществляется поиск: для запуска достаточно просто вбить в строку фамилию и регион проживания
В ответ сервис выдаст весь перечень документов, где упоминается заданная фамилия. Текст со всех сканов продублирован в печатном виде, чтобы пользователю не пришлось разбираться в почерке и старых символах
Почему это важно. Оцифровка архивных документов делает взаимодействие с ними проще и удобнее. Например, вместо самостоятельного поиска по странице в браузере можно просто нажать Ctrl + F, ввести текст для поиска и компьютер сам найдет нужную информацию