关键信息
• 纳入的研究显示人工智能(artificial intelligence, AI)能辨识圆锥角膜。这可能实现早期发现及避免视力丧失。
• 对不同AI算法的评估相类似。
• 我们对相关证据没有足够的信心,有需要对此议题进行更多研究。
什么是圆锥角膜?为什么(早期)诊断如此重要?
圆锥角膜是眼角膜的疾病(眼睛前方的透明窗口),影响的人群年龄在10到40岁。在那些受影响的患者中,角膜会随著时间变弱与变薄,逐渐地突出成典型圆锥体的形状,并导致视力下降。眼镜能解决圆锥角膜早期阶段问题,但当疾病变得较严重时,它就不再是一个令人满意的解决方式。早期诊断是必要的,这能确保对患者的随访与治疗,从而避免视力丧失。
圆锥角膜的诊断是以眼睛检查(以光线垂直发光与显微镜来测量眼睛及评价眼角膜)与影像(建立眼角膜三度空间照片或地图的电脑辅助技术)为基准。解释图像是个挑战,特别是在初级眼科保健单位以及此疾病的早期阶段。无法辨识圆锥角膜会导致其恶化及视觉退化。例如,有圆锥角膜风险的患者接受激光视力矫正手术(手术来矫正他们眼睛)最终会视力恶化。
什么是人工智能以及它如何来帮助诊断圆锥角膜?
以影像为基础来诊断圆锥角膜是不容易的,特别是对于未训练过的临床人员。人工智能带给机器适应,逻辑思考,及找出解决方案的能力。演算法能被开发与训练来分析眼角膜影像及识别圆锥角膜。这些测试能帮助眼科医师、验光师及其它眼睛专业照护者来进行诊断,并及时将圆锥角膜患者转诊给眼角膜专家,保护患者视力。有很多不同类型演算法,但是他们都依照眼角膜影像基准来判别健康眼睛及圆锥角膜。
研究目的
研究的目标是要明确人工智能能否在寻求激光视力矫正手术及视力不能由戴眼镜矫正的患者中正确地诊断出圆锥角膜患者。
研究方法
我们检索研究人工智能诊断圆锥角膜准确性的研究,尤其是在激光视力矫正手术的患者或那些不能在透过戴眼镜来矫正的患者中进行的研究。我们对照及总结研究结果来计算两种准确性的测量:敏感度(人工智能正确识别圆锥角膜的能力)及特殊性(人工智能正确排除圆锥角膜的能力)。灵敏度和特异性越接近100%,算法越好。
研究发现
我们发现63项研究,使用三种不同单位(眼睛,受试者,及影像)来分析人工智能对于诊测圆锥角膜的准确性:44项研究分析23771双眼睛,4项研究分析3843位受试者,及15项研究分析38832张影像。
人工智能检测显性圆锥角膜的准确性(经由临床检测的圆锥角膜)是很高的。如果有1000位患者接受检测,会有30位圆锥角膜患者能正确被发现转诊给眼角膜专家,不会漏掉任何一位。其它970受检测者(没有圆锥角膜),只有17位会被错误的转诊。这些受试者会接受额外非入侵式检测确认它们是否有圆锥角膜。
对于检测早期圆锥角膜,人工智能的准确性较低。如果有1000位接受检测,有圆锥角膜的9位受试者将会正确地转诊给眼角膜专家,1位将会被遗漏。如果这位受试者接受激光视力矫正手术,它将会加剧病况及造成视力恶化。其余990位受试者(没有圆锥角膜)中,941位会被确认他们没有得病,会接受激光视力矫正手术或戴眼镜,49位受试者会被错误转诊。
证据显示人工智能也许对于检测显性圆锥角膜是有帮助的,但是也许对于筛检早期圆锥角膜不是那么理想。
证据局限性
我们对关于人工智能检测显性圆锥角膜准确性的证据信心比较少,对关于人工智能检测早期圆锥角膜的证据几乎没有信心。研究的进行方式存在问题,可能导致人工智能看起来比实际更准确。
证据的时效性如何?
证据更新至2022年11月29日。
人工智能似乎是眼科实践中诊断圆锥角膜的一种有前景的分类工具。对于显性圆锥角膜,测试准确性非常高,而对于亚临床圆锥角膜,测试准确性稍低,这表明对于没有临床症状的人来说,漏诊的可能性更高。这可能导致圆锥角膜进展或屈光手术的错误指征,从而使疾病恶化。
由于偏倚风险高、结果无法解释的异质性以及高适用性问题,我们无法得出清晰可靠的结论,所有这些都降低了证据质量。
未来研究中更高的标准化程度将提高研究质量并提高研究之间的可比性。
圆锥角膜仍然难以诊断,尤其是在早期阶段。这是一种从年轻时就开始的进行性角膜疾病。对它的诊断基于临床检查和角膜成像;尽管在早期阶段,当没有临床症状时,诊断基于训练有素的角膜专家对角膜成像(例如地形图和断层扫描)的解释。使用人工智能(artificial intelligence, AI)分析角膜图像并检测圆锥角膜病例可以帮助预防视力丧失甚至角膜移植。然而,对寻求屈光手术的患者的漏诊可能会导致角膜变弱和圆锥角膜样扩张。需要对人工智能检测圆锥角膜的准确性以及这种自动化方法在临床环境中的适用性进行可靠的综述。
评价人工智能(AI)算法在屈光不正患者中检测圆锥角膜的诊断准确性,特别是那些无法再通过眼镜完全矫正视力的患者、寻求角膜屈光手术的患者以及疑似患有圆锥角膜的患者。人工智能可以帮助眼科医生、验光师和其他眼保健专业人员做出转诊至角膜专家的决定。
次要研究目的
评价研究间诊断性能异质性的以下潜在原因。
•不同的人工智能算法(例如神经网络、决策树、支持向量机)
•指数测试方法(预处理技术、核心AI方法、后处理技术)
•训练算法的输入源(来自Placido盘系统、Scheimpflug系统、狭缝扫描系统或光学相干断层扫描(optical coherence tomography, OCT)的地形和断层扫描图像;训练和测试案例/图像的数量;用于训练的标签/端点变量)
•研究环境
•研究设计
•种族或地理区域作为其代表
•地形或断层扫描设备提供的不同指数测试阳性标准
•参考标准、地形图或断层扫描、一或两名角膜专家
•圆锥角膜的定义
•受试者的平均年龄
•招募受试者
•圆锥角膜的严重程度(临床表现或亚临床)
我们检索了Cochrane对照试验中心注册库(Cochrane Central Register of Controlled Trials, CENTRAL,包含Cochrane眼睛和视力试验注册中心)、Ovid MEDLINE、Ovid Embase、OpenGrey、ISRCTN注册中心、美国临床试验注册平台(Clinicaltrials.gov)和世界卫生组织国际临床试验注册平台(World Health Organization International Clinical Trials Registry Platform, WHO ICTRP)。在电子检索时,我们未对试验的数据或语言进行限制。我们最后一次检索电子数据库是在2022年11月29日。
我们纳入了横断面和诊断性病例对照研究,研究人工智能使用地形图、断层扫描或两者来诊断圆锥角膜。我们纳入了诊断明显圆锥角膜、亚临床圆锥角膜或两者兼而有之的研究。参考标准是至少两名角膜专家对地形或断层扫描图像的解释。
两位综述作者独立提取研究资料并使用诊断准确性研究质量评价(QUADAS-2)工具评价研究质量。当一篇文章包含多种AI算法时,我们选择Youden指数最高的算法。我们使用GRADE方法评价证据质量。
我们纳入了1994年至2022年间发表的63项研究,这些研究开发并调查了人工智能诊断圆锥角膜的准确性。研究中存在三个不同的分析单位:眼睛、受试者和图像。44项研究分析了23771只眼睛,4项研究分析了3843名受试者,15项研究分析了38832张图像。
54篇文章评价了显性圆锥角膜的检测,显性圆锥角膜定义为显示任何圆锥角膜临床症状的角膜。AI的准确性似乎近乎完美,汇总敏感性为98.6%(95% CI [97.6%, 99.1%]),汇总特异性为98.3%(95% CI [97.4%, 98.9%])。然而,不同研究的准确性各不相同,而且证据质量低。
尽管亚临床圆锥角膜的定义各不相同,但有28篇文章评价了亚临床圆锥角膜的检测。我们将亚临床圆锥角膜、扁平角膜和非常不对称的眼睛归为一类。测试显示出良好的准确性,总体敏感性为90.0%(95% CI [84.5%, 93.8%]),总体特异性为95.5%(95% CI [91.9%, 97.5%])。然而,关于敏感性的证据质量极低和特异性的证据质量低。
在这两组中,在患者选择领域,大多数研究被评为高偏倚风险,存在高度适用性问题,因为大多数研究都是病例对照研究。此外,由于选择偏倚、不一致和不精确性,我们将证据质量评为低至极低。
我们无法解释研究之间的异质性。基于研究设计、人工智能算法、成像技术(地形与断层扫描)和数据源(参数与图像)的敏感性分析显示结果没有差异。
译者:张楠婷(北京中医药大学人文学院),审校:尹珩(北京中医药大学20级英语(医学)),2024年3月11日。简体中文翻译由Cochrane中国协作网成员单位,北京中医药大学循证医学中心翻译传播工作组负责,联系方式:tina000341@163.com