Czy sztuczna inteligencja (ang. artificial intelligence; AI) jest lepsza od człowieka w diagnozowaniu „wysiękowego zwyrodnienia plamki żółtej związanego z wiekiem”?

Najważniejsze informacje

• Badania oparte na sztucznej inteligencji (AI) w porównaniu do oceny specjalisty mogą być porównywalnie dokładne w wykrywaniu wysiękowej (lub mokrej) postaci zwyrodnienia plamki żółtej związanej z wiekiem (ang. exudative age-related macular degeneration; eAMD).

• Nie było znaczących różnic w skuteczności bez względu na to jakie by stan narządu wzroku w zbiorze danych obrazu lub jakie typy obrazów zostały użyte.

• Potrzeba więcej badań i spójnych raportów, aby określić rolę AI w diagnozowaniu eAMD.

Czym jest zwyrodnienie plamki żółtej związane z wiekiem?
Plamka to centralna część siatkówki, która znajduje się w tylnej części oka. Wraz z wiekiem komórki w plamce żółtej obumierają lub ulegają uszkodzeniu, co utrudnia wyraźne widzenie. Zwyrodnienie plamki żółtej związane z wiekiem (ang. age-related macular degeneration; AMD) jest powszechną chorobą oczu, która może pogorszyć się do wysiękowego (lub mokrego) AMD (ang. exudative age-related macular degeneration; eAMD), które ogranicza widzenie w centrum oka z powodu wzrostu nieprawidłowych naczyń krwionośnych. Dokładna diagnoza eAMD jest ważna, szczególnie ze względu na umożliwienie pacjentom leczenia u specjalisty chorób siatkówki. Tradycyjne metody diagnozowania eAMD bazują na specjalistycznej opiece okulistycznej i wielu technikach obrazowania, co może być czasochłonne i wymaga znacznych zasobów. Badania wykorzystujące AI obiecują automatyczną identyfikację eAMD. Takie rozwiązanie mogłoby pomóc większej liczbie osób z AMD zbadać wzrok, a w konsekwencji otrzymać szybką diagnozę i leczenie.

Jak AI może pomóc?
AI to gałąź informatyki, której celem jest wykonywanie zadań, które tradycyjnie wymagają wykorzystania ludzkiej inteligencji. Aplikacje AI zostały opracowane w celu badania obrazów oka i przeszkolone w zakresie wybierania tych, które mogą wskazywać na oznaki eAMD. Pacjenci mogą być kierowani we właściwym czasie na leczenie, a lekarze okuliści są odciążani od wykonywania czasochłonnych badań wzroku.

Czego chcieliśmy się dowiedzieć?
Chcieliśmy dowiedzieć się, jak dokładne są testy AI w porównaniu z oceną człowieka w diagnozowaniu eAMD na podstawie obrazów oczu.

Co zrobiliśmy?
Szukaliśmy badań w dowolnym miejscu na świecie, które porównywały wyniki diagnostyczne testów AI z wynikami ocenianymi przez człowieka w odczytywaniu obrazów oczu w celu zdiagnozowania eAMD. Obrazy oczu mogły pochodzić od pacjentów szukających opieki okulistycznej w klinice środowiskowej lub klinicznym centrum medycznym lub z bazy danych. Wyniki odczytu oparte na AI zostały porównane z wynikami odczytu przeprowadzonymi przez specjalistów, którzy oceniali obrazy przed analizą AI.

Czego się dowiedzieliśmy?
Zidentyfikowaliśmy 36 badań z udziałem ponad 16 000 osób i 62 000 zdjęć, w których przedstawiono wyniki 41 różnych badań AI. Ponad połowa badań została przeprowadzona w Azji, a następnie w Europie, USA i we współpracy wielu krajów. Średnio 33% osób biorących udział w badaniach miało eAMD.

Dla trzech badań AI ocenianych na nowych danych innych niż obrazy treningowe, po ich zastosowaniu celem wykrycia eAMD u 10 000 osób (w tym 100, które faktycznie miały eAMD), badania AI błędnie zidentyfikowałyby około 99 osób jako mających eAMD (wyniki fałszywie dodatnie) i pominęłyby około 6 przypadków (wyniki fałszywie ujemne).

W przypadku 28 testów AI ocenianych wyłącznie na danych szkoleniowych, przy użyciu tego samego scenariusza, testy błędnie zidentyfikowałyby około 396 osób jako cierpiących na eAMD (wyniki fałszywie dodatnie) i pominęłyby około 7 przypadków (wyniki fałszywie ujemne).

Testy AI wykazały podobną wydajność jak specjaliści, niezależnie od tego, czy były oceniane przy użyciu obrazów z ich zestawu treningowego, czy z nowego zbioru danych. Skuteczność była podobna w przypadku zbiorów danych obrazów eAMD i różnych grup kontrolnych lub typów obrazów.

Jakie są ograniczenia prezentowanych danych naukowych?
Większość uwzględnionych badań miała wady w wyborze, szkoleniu lub ocenie testów AI. Te wady badania mogły sprawić, że wyniki testu wydawały się lepsze niż były w rzeczywistości. W związku z tym nasze zaufanie do dokładności wyników testu było niskie. Przyszłe badania powinny rekrutować uczestników, których wiek i stopień zaawansowania choroby odzwierciedlają rzeczywiste warunki.

Jak aktualne są przedstawione dane naukowe?
Przedstawione dane naukowe są aktualne do kwietnia 2024 roku.

Uwagi do tłumaczenia: 

Tłumaczenie: Maria Kowalczyk Redakcja: Małgorzata Maraj

Tools
Information