원추각막 진단을 위한 인공 지능은 얼마나 정확합니까?

주요 메시지

• 포함된 연구에서는 인공지능(artificial intelligence, AI)이 원추각막을 식별할 수 있음을 시사한다. 이를 통해 시력 상실을 조기에 발견하고 예방할 수 있다.
• 다양한 유형의 AI 알고리즘에 대한 추정치는 유사했다.
• 근거에 대한 확신이 거의 없다. 이 주제에 대해 더 많은 연구가 필요하다.

원추각막이란 무엇이며 (조기) 진단이 왜 그렇게 중요한가요?

원추각막은 10~40세 사이의 사람들에게 영향을 미치는 각막(눈 앞쪽의 투명한 창) 질환이다. 영향을 받은 사람들의 경우, 각막은 수년에 걸쳐 약화되고 얇아지며, 점차 전형적인 원뿔 모양으로 부풀어 오르고 이로 인해 시력이 저하된다. 안경은 원추각막의 초기 단계에서 이 문제를 해결할 수 있지만, 질병이 더욱 심해짐에 따라 더 이상 만족스러운 해결책을 제공하지 못한다. 지속적인 관찰과 치료를 통해 시력 상실을 예방하려면 조기 진단이 필수적이다.

원추각막의 진단은 눈 검사(눈을 측정하고 수직 광선과 현미경으로 각막을 평가함)와 영상(각막의 3차원 그림이나 지도를 생성하는 컴퓨터 보조 기술)을 기반으로 한다. 특히 일차 안과 진료 환경과 질병의 초기 단계에서는 이미지를 해석하는 것이 어려울 수 있다. 원추각막을 인식하지 못하면 질병이 악화되고 시력이 악화될 수 있다. 예를 들어, 굴절 수술(시력 교정을 위한 수술)을 받은 원추각막 발병 위험이 있는 사람들은 결국 시력이 더 나빠질 수 있다.

인공 지능이란 무엇이며 원추각막을 감지하는 데 어떻게 도움이 됩니까?

이미지를 기반으로 원추각막을 감지하는 것은 특히 훈련받지 않은 임상의의 경우 어려운 일이다. AI는 기계에 적응하고, 추론하고, 해결책을 찾는 능력을 제공한다. 각막 이미지를 분석하고 원추각막을 인식하도록 알고리즘을 개발하고 학습시킬 수 있다. 이러한 테스트는 안과의사, 검안사 및 기타 안과 전문의가 진단을 내리고 원추각막 환자를 적시에 각막 전문가에게 의뢰하여 시력을 보존하는 데 도움이 될 수 있다. 다양한 유형의 알고리즘이 있지만 모두 각막 이미지를 기반으로 건강한 눈과 원추각막을 구별한다.

무엇을 확인하고 싶었는가?

검토의 목적은 굴절 수술을 원하는 사람들과 더 이상 안경으로 시력을 완전히 교정할 수 없는 사람들의 원추각막을 AI가 올바르게 진단할 수 있는지 알아보는 것이었다.

무엇을 했는가?

바람직하게는 굴절 수술을 원하는 사람들이나 더 이상 안경으로 시력을 완전히 교정할 수 없는 사람들을 대상으로 원추각막 진단을 위한 AI의 정확성을 조사한 연구를 검색했다. 민감도(원추각막을 정확하게 식별하는 AI의 능력)와 특이도(원추각막을 올바르게 배제하는 AI의 능력)라는 두 가지 정확도 척도를 계산하기 위해 연구 결과를 비교하고 요약했다. 민감도와 특이도가 100 %에 가까울수록 알고리즘가 더 좋다.

무엇을 찾았는가?

원추각막 감지를 위한 AI의 정확도를 분석하기 위해 세 가지 다른 단위(눈, 참가자 및 이미지)를 사용한 63개의 연구를 발견했다. 44개 연구에서는 23,771개의 눈을 분석했고, 4개 연구에서는 3,843명의 참가자를 분석했으며, 15개 연구에서는 38,832개의 이미지를 분석했다.

현성원추각막(임상검사를 통해 검출할 수 있는 원추각막)을 검출하는 AI의 정확도는 높았다. 1000명을 검사하면 원추각막이 있는 30명이 각막 전문의에게 정확하게 의뢰될 것이며 한 명도 놓치지 않을 것이다. (원추각막이 없는) 나머지 970명 중 단 17명만이 잘못 의뢰되었다. 이 사람들은 원추각막이 있는지 확인하기 위해 추가적인 비침습적 검사를 받게 된다.

원추각막을 조기에 감지하는 AI의 정확도는 낮았다. 1000명을 검사하면 원추각막이 있는 9명은 각막 전문의에게 정확하게 의뢰되고 1명은 누락될 것이다. 이 사람이 굴절 수술을 받으면 질병이 악화되고 시력이 악화될 수 있다. 나머지 990명(원추각막 없음) 중 941명은 질병이 없다고 확신하고 굴절 수술이나 안경을 받게 된다. 49명이 잘못 추천되었다.

근거에 따르면 AI는 뚜렷한 원추각막을 감지하는 데는 적합할 수 있지만 초기 원추각막을 선별하는 데는 적합하지 않을 수 있다.

근거의 한계는 무엇인가?

명백한 원추각막을 탐지하는 AI의 정확성에 대한 근거에 대해 거의 확신이 없으며, 초기 원추각막과 관련된 근거에 대해서도 거의 또는 전혀 확신하지 않다. 연구 수행 방식에 문제가 있어 AI가 실제보다 더 정확해 보일 수 있다.

이 문헌고찰은 얼마나 최신인가?

근거는 2022년 11월 29일까지 검색했다.

연구진 결론: 

AI는 원추각막 진단을 위한 안과 진료에서 유망한 분류 도구인 것으로 보인다. 명백한 원추각막의 경우 테스트 정확도가 매우 높았고 무증상 원추각막의 경우 약간 낮았으며, 이는 임상 징후가 없는 사람들의 경우 진단을 놓칠 가능성이 더 높다는 것을 나타낸다. 이로 인해 원추각막이 진행되거나 굴절 수술에 대한 잘못된 적응증이 발생하여 질병이 악화될 수 있다.

높은 비뚤림 위험, 설명할 수 없는 결과의 이질성, 높은 적용 가능성 우려로 인해 명확하고 신뢰할 수 있는 결론을 도출할 수 없으며, 이 모든 것이 근거에 대한 신뢰도를 감소시켰다.

향후 연구에서 표준화가 강화되면 연구의 질이 향상되고 연구 간 비교 가능성이 향상될 것이다.

전체 초록 읽기
배경: 

원추각막은 특히 초기 단계에서 진단하기가 어렵다. 이는 어린 나이에 시작되는 진행성 각막 장애이다. 진단은 임상 검사와 각막 영상을 기반으로 이루어지다. 그러나 임상 징후가 없는 초기 단계에서는 숙련된 각막 전문가의 각막 영상(예: 지형도 및 단층 촬영)의 해석에 따라 진단이 달라지다. 인공지능(artificial intelligence, AI)을 활용해 각막 영상을 분석하고 원추각막 사례를 탐지하면 시력 손실은 물론 각막 이식까지 예방하는 데 도움이 될 수 있다. 그러나 굴절 수술을 원하는 사람들이 진단을 잘못하면 각막이 약화되고 원추각막과 같은 확장증이 발생할 수 있다. 원추각막을 감지하기 위한 AI의 정확성과 이 자동화된 방법을 임상 환경에 적용하는 가능성에 대한 신뢰할 수 있는 개요가 필요하다.

목적: 

굴절 이상이 있는 사람, 특히 안경으로 시력을 완전히 교정할 수 없는 사람, 각막 굴절 수술을 원하는 사람, 원추각막이 의심되는 사람의 원추각막을 감지하기 위한 인공지능(AI) 알고리즘의 진단 정확도를 평가하다. AI는 안과의사, 검안사, 기타 안과 전문의가 각막 전문의에게 의뢰하는 결정을 내리는 데 도움을 줄 수 있다.

2차 목표

연구 전반에 걸쳐 진단 성능의 이질성에 대한 다음과 같은 잠재적 원인을 평가하다.

• 다양한 AI 알고리즘(예: 신경망, 의사결정 트리, 지원 벡터 머신)
• 지수 테스트 방법론(전처리 기법, 핵심 AI 기법, 후처리 기법)
• 훈련 알고리즘을 위한 입력 소스(Placido 디스크 시스템, Scheimpflug 시스템, 슬릿 스캐닝 시스템 또는 광간섭 단층 촬영(OCT)의 지형 및 단층 촬영 이미지, 훈련 및 테스트 사례/이미지 수, 훈련에 사용되는 레이블/종점 변수)
• 연구 설정
• 연구 설계
민족 또는 대리인으로서의 지리적 영역
• 토포그래피 또는 단층 촬영 장치에서 제공하는 다양한 지수 테스트 양성 기준
• 참조 표준, 지형도 또는 단층 촬영, 각막 전문가 1~2명
• 원추각막의 정의
• 참가자의 평균 연령
• 참가자 모집
• 원추각막의 중증도(임상적으로 나타나거나 무증상)

검색 전략: 

CENTRAL(Cochrane Eyes and Vision Trials Register 포함), Ovid MEDLINE, Ovid Embase, OpenGrey, ISRCTN 레지스트리, ClinicalTrials.gov 및 세계보건기구 국제 임상시험 등록 플랫폼(WHO ICTRP)을 검색했다. 연구 전자 검색에 대한 언어의 제한은 없었다. 2022년 11월 29일에 전자 데이터베이스를 마지막으로 검색했다.

선정 기준: 

지형도, 단층촬영 또는 둘 다를 사용하여 원추각막 진단을 위해 AI를 조사한 단면적 및 진단 사례 관리 연구를 포함했다. 명백한 원추각막, 무증상 원추각막 또는 둘 다를 진단한 연구를 포함했다. 참조 표준은 최소 두 명의 각막 전문가가 지형 또는 단층 촬영 이미지를 해석한 것이었다.

자료 수집 및 분석: 

두 명의 검토 저자는 독립적으로 데이터를 추출하고 진단 정확도 연구 품질 평가(QUADAS-2)를 사용하여 연구 품질을 평가하였다. 기사에 여러 AI 알고리즘이 포함된 경우 Youden 지수가 가장 높은 알고리즘을 선택했다. GRADE 접근법을 사용하여 근거의 확실성을 평가했다.

주요 결과: 

1994년부터 2022년 사이에 발표된 원추 각막 진단을 위한 AI의 정확성을 개발하고 조사한 63개의 연구를 포함했다. 연구에는 눈, 참가자, 이미지라는 세 가지 분석 단위가 있었다. 44개 연구에서는 23,771개의 눈을 분석했고, 4개 연구에서는 3,843명의 참가자를 분석했으며, 15개 연구에서는 38,832개의 이미지를 분석했다.

54개의 기사에서는 원추각막의 임상 징후를 보이는 각막으로 정의되는 명백한 원추각막의 검출을 평가했다. AI의 정확도는 요약 민감도 98.6%(95% 신뢰구간(CI) 97.6%~99.1%), 요약 특이도 98.3%(95% CI 97.4%~98.9%)로 거의 완벽해 보인다. 그러나 연구마다 정확도가 달랐고 근거의 확실성은 낮았다.

무증상 원추각막의 정의는 다양했지만, 28개의 기사에서 무증상 원추각막의 검출을 평가했다. 무증상 원추각막, 절상형 눈, 매우 비대칭인 눈을 함께 그룹화했다. 테스트 결과 요약 민감도는 90.0%(95% CI 84.5%~93.8%), 요약 특이도는 95.5%(95% CI 91.9%~97.5%)로 좋은 정확도를 보였다. 그러나 근거의 확실성은 민감도가 매우 낮고 특이도가 낮았다.

두 그룹 모두에서 대부분의 연구는 사례 대조 연구였기 때문에 환자 선택 영역에서 비뚤림 위험이 높고 적용 가능성에 대한 우려가 높은 것으로 등급을 매겼다. 또한 선택 편향, 불일치 및 부정확성으로 인해 근거의 확실성을 낮음에서 매우 낮음으로 평가했다.

연구 간의 이질성을 설명할 수 없었다. 연구 설계, AI 알고리즘, 영상 기법(지형 대 단층 촬영), 데이터 소스(매개변수 대 이미지)를 기반으로 한 민감도 분석에서는 결과에 차이가 없는 것으로 나타났다.

역주: 

위 내용은 한국코크란에서 번역하였다.

Tools
Information