Kann künstliche Intelligenz (KI) die Augenerkrankung "feuchte altersbedingte Makuladegeneration" besser diagnostizieren als Menschen?

Kernaussagen

- Im Vergleich zu menschlichen Expert*innen erkennen auf künstlicher Intelligenz (KI) basierende Tests die exsudative (oder feuchte) Form der altersbedingten Makuladegeneration (eAMD) möglicherweise vergleichbar sicher.

- Es wurden keine signifikanten Leistungsunterschiede festgestellt, unabhängig davon, ob andere Augenerkrankungen im Bilddatensatz vorhanden waren oder welche Bildtypen verwendet wurden.

- Es sind weitere Forschung und eine einheitliche Berichterstattung erforderlich, um die Rolle der KI bei der Diagnose von eAMD zu definieren.

Was ist altersbedingte Makuladegeneration?
Die Makula ist der zentrale Teil der Netzhaut, die sich im hinteren Teil des Auges befindet. Mit zunehmendem Alter sterben Zellen in der Makula ab oder werden geschädigt, so dass es für die Betroffenen schwierig wird, scharf zu sehen. Die altersbedingte Makuladegeneration (AMD) ist eine verbreitete Augenkrankheit, die in eine schwerere Form, die sogenannte feuchte AMD (eAMD), übergehen kann. Bei dieser fortgeschrittenen Form wird das zentrale Sehvermögen durch das unkontrollierte Wachstum von abnormalen Blutgefäßen beeinträchtigt. Die richtige Diagnose von eAMD ist wichtig, da sie den Betroffenen die Behandlung durch einen Netzhautspezialisten ermöglicht. Klassische Diagnoseverfahren für eAMD erfordern den Einsatz von spezialisiertem Fachpersonal und mehreren bildgebenden Techniken, was sowohl zeit- als auch ressourcenintensiv sein kann. Tests, die auf künstlicher Intelligenz (KI) basieren, versprechen, eAMD automatisch zu erkennen. Dies könnte dazu beitragen, dass mehr Menschen mit AMD ihre Augen untersuchen lassen und eine rechtzeitige Diagnose und Behandlung erhalten.

Wie kann künstliche Intelligenz (KI) helfen?
Künstliche Intelligenz ist ein Bereich der Informatik, der darauf abzielt, Aufgaben zu lösen, die normalerweise menschliches Denken und Fähigkeiten erfordern. Es wurden KI-Anwendungen entwickelt, die Bilder des Auges untersuchen und darauf trainiert sind, solche auszuwählen, die Anzeichen von eAMD aufweisen könnten. Auf diese Weise könnten die Patient*innen rechtzeitig zur Behandlung überwiesen werden, während das Fachpersonal von zeitintensiven Augenuntersuchungen entlastet wird.

Was wollten wir herausfinden?
Wir wollten herausfinden, wie genau KI-Tests im Vergleich zu menschlichen Expert*innen bei der Diagnose von eAMD anhand von Bildern der Augen sind.

Wie gingen wir vor?
Wir suchten nach Studien aus der ganzen Welt, die die diagnostische Leistung von KI-Tests mit der von menschlichen Expert*innen beim Auswerten von Bildern der Augen zum Diagnostizieren von eAMD verglichen. Die Bilder können von Patient*innen stammen, die sich in einer Praxis oder einem akademischen medizinischen Zentrum behandeln lassen, oder aus einer Bilddatenbank. Die KI-gestützten Untersuchungsergebnisse wurden mit denen von menschlichen Expert*innen verglichen, die die Bilder vor den KI-Tests untersucht hatten.

Was fanden wir?
Wir identifizierten 36 Studien mit mehr als 16.000 Personen und 62.000 Bildern, die Ergebnisse von 41 verschiedenen KI-Tests berichten. Mehr als die Hälfte der Studien wurde in Asien durchgeführt, gefolgt von Europa, den USA und länderübergreifenden Kooperationen. Im Durchschnitt hatten 33 % der Studienteilnehmenden eine eAMD.

Bei den drei KI-Tests, die über die Trainingsbilder hinaus mit neuen Daten getestet wurden, würden beispielsweise die KI-Tests bei der Erkennung von eAMD bei 10.000 Personen (darunter 100, die tatsächlich eAMD hatten) möglicherweise etwa 99 Personen fälschlicherweise mit eAMD diagnostizieren (falsch positiv) und etwa 6 Fälle übersehen (falsch negativ).

Bei den 28 KI-Tests, die ausschließlich anhand von Trainingsdaten getestet wurden, würden die Tests in demselben Szenario möglicherweise etwa 396 Personen fälschlicherweise mit eAMD diagnostizieren (falsch positiv) und etwa 7 Fälle übersehen (falsch negativ).

Die KI-Tests zeigen möglicherweise ähnliche Leistungen wie menschliche Expert*innen, unabhängig davon, ob sie mit Bildern aus ihrem Trainingssatz oder aus einem neuen Datensatz getestet wurden. Die Leistung war bei allen Bilddatensätzen von eAMD sowie beim Vergleich verschiedener Kontrollgruppen oder Bildtypen ähnlich.

Was schränkt die Evidenz ein?
Die meisten der einbezogenen Studien wiesen Mängel bei der Auswahl, dem Training oder der Auswertung der KI-Tests auf. Diese Studienmängel könnten die Testergebnisse besser erscheinen lassen, als sie wirklich waren. Folglich ist unser Vertrauen in die Ergebnisse dieses Reviews gering. Für künftige Studien sollten Teilnehmende rekrutiert werden, deren Alter und Krankheitsschwere den realen Bedingungen entsprechen.

Wie aktuell ist die vorliegende Evidenz?
Die Evidenz ist auf dem Stand von April 2024.

Anmerkungen zur Übersetzung: 

M. Zeitler, B. Schindler, freigegeben durch Cochrane Deutschland

Tools
Information

Cochrane Kompakt ist ein Gemeinschaftsprojekt von Cochrane Schweiz, Cochrane Deutschland und Cochrane Österreich. Wir danken unseren Sponsoren und Unterstützern. Eine Übersicht finden Sie hier.