Конференции / РОСОМЕД-2025 - XIV съезд Российского общества симуляционного обучения в медицине и Международная конференция «Симуляционное обучение в медицине: опыт, развитие, инновации» / Оценка эффективности нейросетевых моделей для автоматизированной классификации качества хирургического шва на ограниченных наборах данных

Оценка эффективности нейросетевых моделей для автоматизированной классификации качества хирургического шва на ограниченных наборах данных

Автор(ы): Ищенко Р.В., Солопов М.В., Турчин В.В., Попандопуло А.Г., Антонюк О.С., Ермак А.А., Ладык К.К., Попивненко Ф.С., Голубицкий К.О., Глебова А.Э., Филимонов Д.А.

Город: Донецк

Учреждение: ФГБУ "ИНВХ им. В.К. Гусака" Минздрава России

Актуальность

Качество наложения хирургического шва – один из ключевых факторов, определяющих успех операции и безопасность пациента. Ошибки в технике сшивания могут приводить к серьезным осложнениям, таким как расхождение краев раны, инфекции и кровотечения. Традиционная оценка качества шва основывается на субъективном мнении экспертов, что не лишено предвзятости и не всегда позволяет стандартизировать оценку. Внедрение объективных, автоматизированных методов оценки является актуальной задачей для повышения качества хирургического обучения и контроля. Технологии искусственного интеллекта, в частности сверточные нейронные сети (CNN), открывают новые возможности для количественной оценки хирургических навыков по фотоизображениям конечного результата.

Цель

Оценить возможность и перспективы разработки программного алгоритма для классификации качества хирургических швов, используя визуальные данные.

Материалы и методы

В исследовании использовались наборы фотографий трех видов хирургических швов, выполненных на биологических материалах (фрагменты сосудов и кишечника свиньи): 1) узловой открытый сосудистый шов – 380 изображений; 2) непрерывный обвивной открытый шов– 105 изображений; 3) узловой лапароскопический шов – 100 изображений.
Швы накладывались хирургами различной квалификации, включая ординаторов и студентов-медиков. Группа из четырех опытных хирургов (стаж более 10 лет) провела аннотирование изображений, разделив их на два класса: «высококачественный» и «низкокачественный». Критериями высокого качества служили равномерность стежков, отсутствие деформации и точное сопоставление тканей.
Для автоматической классификации было обучено восемь современных архитектур нейронных сетей (включая ResNet50V2, DenseNet121, Xception и др.). Для повышения точности на ограниченном объеме данных применялась технология «трансферного обучения», использующая модели, предварительно обученные на большом массиве общих изображений ImageNet. Качество моделей оценивалось с помощью метрик F1-меры, AUC-ROC и специально разработанного взвешенного показателя, учитывающего стабильность результатов (Scoreadj).

Результаты

Несмотря на небольшое количество данных, нейросетевые модели продемонстрировали высокую эффективность в распознавании качества швов. Для узлового сосудистого и лапароскопического швов была достигнута высокая точность классификации (F1-мера > 0,90). Модель ResNet50V2 показала наилучшие и наиболее стабильные результаты для этих типов швов, достигнув AUC-ROC до 0,959±0,008 для внутреннего вида сосудистого шва. Для непрерывного обвивного шва точность была ниже (максимальная F1-мера – 0,79), что, вероятно, связано с меньшей выраженностью визуальных признаков (стежки частично скрыты в ткани). Лучшей моделью для этого типа шва оказалась DenseNet121. Анализ с помощью метода GradCAM подтвердил, что модели концентрировали внимание на клинически значимых областях изображений: линии шва, узлах и краях тканей, что соответствует критериям экспертной оценки.

Обсуждение

Исследование подтверждает, что современные нейросетевые технологии могут эффективно применяться для объективной оценки хирургических навыков даже при работе с ограниченными наборами данных. Использование метода трансферного обучения позволяет адаптировать мощные алгоритмы для узкоспециализированных медицинских задач, не требуя сбора тысяч изображений.
Более низкие результаты для непрерывного шва указывают на то, что некоторые виды хирургических техник представляют большую сложность для автоматического анализа из-за своей специфики. Это открывает направления для дальнейшего усовершенствования алгоритмов.
Разработанный взвешенный показатель Scoreadj позволил не только оценить точность, но и стабильность моделей, что критически важно при внедрении подобных систем в реальную практику. Данная технология имеет высокий потенциал для интеграции в образовательные платформы и симуляционные центры, где она может использоваться для предоставления объективной обратной связи обучающимся, снижая нагрузку на преподавателей и устраняя субъективизм в оценке.

Выводы

Применение сверточных нейронных сетей с технологией трансферного обучения является эффективным и надежным методом для автоматизированной бинарной классификации качества хирургического шва по фотоизображениям. Модели ResNet50V2, DenseNet121 и Xception показали наилучшие и наиболее стабильные результаты. Данный подход представляет собой перспективный инструмент для объективизации оценки и стандартизации контроля качества в хирургическом обучении.

Тема: Искусственный интеллект в медобразовании
Ищенко Роман Викторович

Ваш комментарий будет первым!

Войти или зарегистрироваться, чтобы оставить комментарий.

Вернуться

Еще тезисы к этой конференции:

Новости РОСОМЕД: