Основные положения
• По сравнению с экспертами-людьми, тесты, основанные на искусственном интеллекте (ИИ), могут быть сопоставимо точными в выявлении экссудативной (или влажной) формы возрастной макулярной дегенерации (ВМД), эВМД.
• Не было выявлено существенных различий в результатах независимо от других состояний глаз в наборе данных изображений или используемых типов изображений.
• Для определения роли ИИ в диагностике ВМД необходимы дополнительные исследования и последовательная отчетность.
Что такое возрастная макулярная дегенерация?
Макула - это центральная часть сетчатки, расположенная в задней части глаза. С возрастом клетки макулы отмирают или повреждаются, что затрудняет четкое зрение. Возрастная макулярная дегенерация (ВМД) - распространенное заболевание глаз, которое может усугубиться до экссудативной (или влажной) ВМД (эВМД), снижающей зрение в центре глаза из-за роста аномальных кровеносных сосудов. Точная диагностика эВМД очень важна, поскольку позволяет пациентам получить лечение у специалиста по сетчатке. Традиционные методы диагностики эВМД предполагают участие специалиста-офтальмолога и использование нескольких методов визуализации, что может отнимать много времени и ресурсов. Тесты, использующие искусственный интеллект (ИИ), обещают автоматически определять эВМД. Это может помочь большему числу людей с ВМД пройти обследование глаз и получить своевременную диагностику и лечение.
Чем может помочь искусственный интеллект?
ИИ - это отрасль компьютерной науки, целью которой является выполнение задач, традиционно требующих человеческого интеллекта. Были разработаны приложения искусственного интеллекта для изучения изображений глаз и обучения отбору тех изображений, которые могут иметь признаки эВМД. Пациенты могут быть направлены на своевременное лечение, а офтальмологи освобождаются от трудоемких проверок зрения.
Что мы хотели выяснить?
Мы хотели выяснить, насколько точны тесты ИИ по сравнению с экспертами-людьми в диагностике эВМД по изображениям глаз.
Что мы сделали?
Мы провели поиск исследований, проведённых в любой точке мира, в которых сравнили диагностические характеристики тестов искусственного интеллекта и экспертов-людей при чтении изображений глаз для диагностики эВМД. Изображения могут быть получены от пациентов, обращающихся за помощью по поводу зрения (глаз) в районную поликлинику или академический медицинский центр, или из базы данных изображений. Результаты считывания, полученные с помощью ИИ, сравнивали с результатами, полученными экспертами-людьми, которые просматривали изображения перед тестированием ИИ.
Что мы обнаружили?
Мы выявили 36 исследований, в которых приняли участие более 16 000 человек и 62 000 изображений, и в которых были представлены результаты 41 различного теста ИИ. Более половины исследований были проведены в Азии, за ней следуют Европа, США и многонациональные коллаборации. В среднем 33% людей, участвовавших в исследованиях, имели эВМД.
Для всех трёх тестов ИИ, оцененных на новых данных, помимо учебных изображений, при применении для выявления эВМД у 10 000 человек (включая 100 человек, у которых действительно была эВМД), тесты ИИ неправильно определили бы наличие эВМД примерно у 99 человек (ложноположительные результаты) и пропустили бы примерно 6 случаев (ложноотрицательные результаты).
Для 28 тестов ИИ, оцененных исключительно на обучающих данных, при использовании того же сценария, тесты ошибочно определили бы около 396 человек как имеющих эВМД (ложноположительные результаты) и пропустили бы около 7 случаев (ложноотрицательные результаты).
Тесты ИИ продемонстрировали результаты, схожие с оценками экспертами-людьми, независимо от того, оценивали ли с их помощью изображения из обучающего набора или из нового набора данных. Результаты были одинаковыми для всех наборов данных изображений эВМД и различных контрольных групп или типов изображений.
Каковы ограничения этих доказательств?
В большинстве включённых исследований были обнаружены недостатки в выборе, обучении или оценке тестов ИИ. Эти недостатки исследований могли привести к тому, что результаты теста оказались лучше, чем они были на самом деле. Следовательно, наша уверенность в точности результатов теста была низкой. В будущих исследованиях следует набирать участников, возраст и тяжесть заболевания которых отражают реальные условия.
Насколько актуальны эти доказательства?
Доказательства актуальны на апрель 2024 года.
Перевод: Зиганшин Айрат Усманович. Редактирование: Зиганшина Лилия Евгеньевна. Координация проекта по переводу на русский язык: Cochrane Russia - Кокрейн Россия на базе Российской медицинской академии непрерывного профессионального образования (РМАНПО). По вопросам, связанным с этим переводом, пожалуйста, обращайтесь к нам по адресу: cochranerussia@gmail.com