人工智慧 (AI) 是否比人類診斷眼部情況 "濕性老年黃斑部病變" 更好?

關鍵訊息

• 與人類專家相比,基於人工智慧(AI)的測試在檢測老年性黃斑部病變滲出型(或濕性 AMD,eAMD)方面可能具有相當的準確性。

• 無論圖像數據集中的其他眼部病況或使用的圖像類型為何,性能均無顯著差異。

• 需要更多研究與一致的報告來定義人工智慧在老年黃斑部病變診斷的角色。

什麼是老年黃斑部病變?
黃斑是位於眼睛後方視網膜的中間部分。 隨著年齡增長,黃斑細胞的死亡或受損,對他們來說要清楚地看見變的很不容易。老年黃斑部病變(AMD)是一種常見的眼部疾病,可能惡化為滲出型(或濕性)AMD(eAMD),由於異常血管的生長,會導致眼睛中央視力下降。準確診斷滲出型 AMD(eAMD)至關重要,因為這能讓患者及時接受視網膜專家的治療。傳統診斷滲出型 AMD(eAMD)的方法依賴於眼科專家和多種成像技術,這可能耗費大量時間和資源。利用人工智慧(AI)的測試有望自動識別滲出型 AMD(eAMD)。這能幫助更多 AMD 的人來檢查他們的眼睛並及時接受診斷與治療。

人工智慧能如何幫忙?
人工智慧是電腦科學的分支,用於達成傳統上需要人類智慧的任務。人工智慧(AI)應用已被開發來檢查眼部圖像,並經過訓練以篩選可能顯示滲出型 AMD(eAMD)跡象的圖像。病人可以獲得及時轉診治療,而眼科專家則能從耗時的眼部檢測中解放出來。

我們想要了解甚麼?
我們希望了解人工智慧(AI)測試在從眼部圖像診斷滲出型 AMD(eAMD)方面與人類專家相比的準確性如何。

我們進行了什麼研究?
我們檢索來自世界各地的研究,將人工智慧測試診斷效能與人類專家解讀診斷老年黃斑病變眼睛影像來比較。這些圖像可能來自尋求眼科護理的社區診所或學術醫療中心的病人,也可能來自圖像數據庫。基於人工智慧(AI)的閱讀結果與人類專家在進行 AI 測試之前審查圖像的結果進行了比較。

研究中發現了什麼?
我們識別 36 項研究與超過 16,000 位人員及 62,000 張影像,報告了 41 種不同人工智慧測試結果。超過一半的研究在亞洲進行,其次是歐洲、美國和多國合作研究。平均來說,研究中有 33% 人員患有老年黃斑部病變。

在評估的三種基於人工智慧(AI)的測試中,當使用超出訓練圖像的新數據來檢測 10,000 名個體中的滲出型 AMD(eAMD)(其中 100 人實際患有 eAMD)時,AI 測試會錯誤地將約 99 人判定為患有 eAMD(假陽性),並漏診約 6 例(假陰性)。

在僅基於訓練數據評估的 28 種人工智慧(AI)測試中,按照相同情境,這些測試會錯誤地將約 396 人判定為患有滲出型 AMD(eAMD)(假陽性),並漏診約 7 例(假陰性)。

無論是使用訓練數據集中的圖像還是新的數據集進行評估,人工智慧(AI)測試的表現都與人類專家相當。在滲出型 AMD(eAMD)的圖像數據集以及不同對照組或圖像類型中,測試的性能均表現相似。

證據的侷限性是什麼?
大多數納入的研究在選擇、訓練或評估人工智慧測試上有瑕疵。這些研究瑕疵讓測試結果比它們原來更好。總之,我們的信心在測試結果正確性上是低的。未來研究應該招募年齡大與生病嚴重的受試者來反應真實世界的情況。

證據的最後更新日期?
證據更新截至 2022 年 4 月。

翻譯紀錄: 

翻譯者:許耀彰【本翻譯計畫由臺北醫學大學考科藍臺灣研究中心(Cochrane Taiwan)、東亞考科藍聯盟 (EACA) 統籌執行。聯絡E-mail:cochranetaiwan@tmu.edu.tw】

Tools
Information