研究背景
COVID-19是一种由SARS-CoV-2病毒引起的传染病,它很容易在人与人之间传播,传播方式类似于普通感冒或流感。COVID-19患者多数有轻度至中度呼吸道疾病,有些人可能没有症状(无症状感染)。有的人则出现严重症状,需要专科治疗和重症监护。
COVID-19患者的免疫系统会通过产生可攻击血液中病毒的蛋白质(抗体)来应对感染。检测人们血液中抗体的测试可能会显示他们目前是否感染了COVID-19或以前是否曾被感染。
为什么准确的测试很重要?
准确的测试可以识别可能需要治疗的人,或者需要自我隔离以防止感染传播的人。如果未能及时发现COVID-19患者(假阴性结果),可能会延误治疗,并有进一步感染他人的风险。当COVID-19不存在时,错误地识别COVID-19(假阳性结果)可能会导致不必要的进一步检测、治疗,以及隔离当事人和密切接触者。正确识别曾感染过COVID-19的人,有助于评估疾病传播、评估公共卫生干预措施(如隔离)的成功与否,以及潜在地识别具有免疫力的人群(如果将来能以抗体表明具有免疫力的话)。
为了识别假阴性和假阳性结果,对已知COVID-19感染者和未感染者的抗体检测结果进行比较。根据“参考标准”,将受试者分为已知COVID-19感染者或未感染者两组。许多研究使用从鼻咽和口咽采集的样本来识别COVID-19。样品经过称为逆转录酶聚合酶链反应(reverse transcriptase polymerase chain reaction,RT-PCR)的测试。该测试过程有时可能会漏诊感染(假阴性结果),但进一步的测试可以在RT-PCR测试呈阴性的人中识别COVID-19感染。这些措施包括评估临床症状(例如咳嗽或高热)或影像检查(例如胸部X光片)。有时会从COVID-19出现之前采集的血液样本中,或从由其他疾病引起呼吸道症状的患者中识别出未感染COVID-19的人。
本系统综述研究了什么?
研究专注于三种类型的抗体:IgA,IgG和IgM。大多数测试都同时检测IgG和IgM,但有些测试则测量单个抗体或这三种抗体的组合。
感染后抗体在不同时间升高和降低。IgG是最后上升的抗体,但持续时间最长。抗体水平通常在感染后几周内达到最高。
一些抗体测试需要专门的实验室设备。另一些则使用类似于妊娠试验的一次性装置。这些检测可在实验室或病人所在的任何地方(医疗点)、医院或家中使用。
我们想确定抗体测试是否:
- 足够准确地诊断出有或没有COVID-19症状的人的感染情况,以及
- 可用于确定某人是否已经感染过COVID-19。
我们做了什么?
我们检索评估抗体测试准确性的研究,这些研究以抗体测试检测当前或过去是否感染COVID-19,并将结果与参考标准相比较。这些研究可以是将任何抗体测试与任何参考标准进行比较。人们可以在医院或社区接受检测。研究可以检测COVID-19已知感染者、未感染者或疑似感染者。
研究特征
我们共纳入了54项相关研究。研究在亚洲(38个),欧洲(15个)以及美国和中国(1个)进行。
46项研究只纳入了在医院中疑似或确诊COVID-19的感染者。29项研究比较了COVID-19患者与健康人或其他疾病患者的抗体检测结果。
并非所有研究都提供了有关受试者年龄和性别的详细信息。通常,我们无法判断研究是评估当前还是过去的感染,因为很少有研究报告受试者是否正在康复。我们没有发现任何仅测试无症状人群的研究。
主要结果
我们的研究结果主要来自38项研究,这些研究提供的结果是基于人们首次发生症状的时间。
首次出现症状一周后的抗体测试仅检测到30%的COVID-19患者。准确度在第2周有所提高,检测到70%,在第3周最高(检测到90%以上)。几乎没有第3周后的证据。在COVID-19未感染者的测试中,有2%的人检测结果为假阳性。
症状开始三周后,IgG/IgM测试的结果表明,如果有1000人进行了抗体测试,而其中有50(5%)确实感染了COVID-19(正如我们在全国筛查调查中所期望的那样):
- 58人的COVID-19测试结果呈阳性。其中,有12人(21%)没有COVID-19(假阳性结果)。
- 942人的COVID-19测试结果呈阴性。其中,有4人(0.4%)实际感染了COVID-19(假阴性结果)。
如果我们对1000名出现过症状的医护人员(在高危环境下)进行测试,其中500人(50%)确实感染了COVID-19:
- 461人的COVID-19测试结果呈阳性。其中,有7人(2%)没有感染COVID-19(假阳性结果)。
- 537人的COVID-19测试结果为阴性。其中,有43人(8%)实际感染了COVID-19(假阴性结果)。
对于不同类型的抗体测试,我们没有发现的令人信服的准确性方面的差异。
本系统综述中各项研究结果的可信度如何?
由于以下几个原因,我们对证据的信心有限。总的来说,研究规模很小,没有使用最可靠的方法,也没有充分报告其结果。通常这些研究未纳入可能在PCR上产生假阴性结果的COVID-19患者,并从出现COVID-19之前进行的测试记录中获取了未感染者的资料。这可能会影响测试的准确性,但无法确定有多大的影响。
本系统综述的结果适用于谁?
大多数受试者都因COVID-19住院,因此与没有住院的症状轻微的人相比,他们的病情可能更严重。这意味着我们不知道对于轻症或无症状的人来说,抗体测试有多准确。
超过一半的研究评估了他们自己开发的测试,其中大多数都无法购买。许多研究作为“预印本”在网上迅速发表。预印本没有经过如已发表研究的严格检查,因此我们不确定它们的可靠性。
由于大多数研究都是在亚洲进行的,因此我们不知道测试结果在世界其他地方是否会相似。
本系统综述的意义是什么?
这项系统综述表明,抗体测试在检测是否感染COVID-19方面可能发挥有用的作用,但使用这些测试的时间很重要。抗体测试可能有助于确认症状超过两周且未进行RT-PCR测试或RT-PCR测试结果阴性的人是否感染COVID-19。抗体测试更适用于在症状开始两周或更长时间后检测是否感染COVID-19,但我们不知道在症状开始五周后测试的效果如何。我们不知道这些测试对轻症或无症状者的效果如何,因为本系统综述中的研究主要是在住院患者中进行的。未来,我们将了解已感染过COVID-19的人群是否对未来的感染具有免疫力。
对于COVID-19感染恢复期的人群,轻症以及无症状病人使用抗体测试的情况,还需要进一步研究。
本系统综述的时效性如何?
本系统综述纳入截至2020年4月27日发表的证据。由于该领域有许多新研究正在发表,因此我们经常更新系统综述。
在症状出现后的第一周,抗体检测的敏感度太低,无法对COVID-19的诊断发挥主要作用,但在RT-PCR检测为阴性或未进行检测的个体中,抗体检测仍可作为其他检测的补充。如果在症状出现后15天或更长时间内使用抗体检测,则可能对检测以前的SARS-CoV-2感染有一定的作用。但是,目前尚不清楚抗体增加的持续时间,并且我们发现症状出现后超过35天的资料很少。因此,我们不能确定这些检测是否适用于公共卫生管理目的的血清效价调查。由于担心存在高风险偏倚和适用性,临床医疗中使用的检测准确度可能低于纳入研究的报告。敏感度主要在住院患者中进行了评估,因此尚不清楚该测试是否能够检测到在轻症和无症状COVID-19感染者中可能出现的较低抗体水平。
COVID-19测试准确性研究的设计,执行和报告需要大幅度改进。研究必须报告自出现症状以来按时间分列的敏感度数据。根据世界卫生组织(World Health Organization,WHO)和中华人民共和国国家卫生健康委员会(China National Health Commission of the People's Republic of China,CDC)的病例定义,应纳入RT-PCR呈阴性的COVID-19阳性病例以及经RT-PCR确诊的病例。我们只能从一小部分可用测试中获取数据,并且需要采取措施以确保所有测试评估结果都可以在公共领域获得,以防止选择性报告。这是一个快速发展的领域,我们计划对该实时系统综述进行持续更新。
严重急性呼吸综合征2型冠状病毒(SARS-CoV-2)及其导致的COVID-19大流行对诊断提出了重要挑战。有几种诊断策略可用于确定当前的感染、排除感染、确定需要特别照护的人群、或检测过去的感染和免疫反应。血清学检测SARS-CoV-2抗体的存在旨在识别先前的SARS-CoV-2感染,并可能有助于确认当前感染的存在。
评估抗体测试的诊断准确性,以确定在社区或基层或二级医疗服务体系中出现的人士是否已感染 SARS-CoV-2,或曾感染 SARS-CoV-2,以及用于血清效价调查的抗体测试的准确性。
我们对Cochrane COVID-19研究注册库(Cochrane COVID-19 Study Register)和伯尔尼大学COVID-19实时证据数据库(the COVID-19 Living Evidence Database from the University of Bern)进行了电子检索,该数据库每天更新PubMed和Embase发表的文章,以及medRxiv和bioRxiv的预印本。此外,我们查阅了COVID-19出版物的存储库。我们未限制检索文献的语种。我们对这次系统综述进行了到2020年4月27日为止的迭代检索。
我们纳入了任何设计的试验准确性研究,这些研究评估了在当前或以前疑似感染SARS-CoV-2的人群中进行的抗体测试(包括酶联免疫吸附法、化学发光免疫法和横向流动分析)或者用于感染筛查的测试。我们还纳入了针对已知的SARS-CoV-2感染者和非感染者进行的研究。我们纳入了所有界定是否感染SARS-CoV-2的参考标准(包括逆转录聚合酶链反应试验(reverse transcription polymerase chain reaction, RT-PCR)和临床诊断标准)。
我们使用QUADAS-2工具评估了研究的可能偏倚和适用性。我们提取了2x2列联表数据,并使用配对森林图表示了每种抗体(或抗体组合)的敏感度和特异度。我们在适当的情况下使用随机效应logistic回归合并了数据,按自症状出现后的时间进行了分层。我们将测试厂家的可用数据制成表格。我们已经使用95%置信区间(confidence intervals,CIs)表示敏感度和特异度估计的不确定性。
我们纳入了57份报告,包含54个研究队列,共15,976个样本,其中8,526个来自SARS-CoV-2感染病例。研究在亚洲(n = 38),欧洲(n = 15),美国和中国(n = 1)进行。我们从25个商业测试和大量内部检测中确定了数据,这些数据是创新诊断基金会(Foundation for Innovative Diagnostics)列出的279个抗体检测中的一小部分。一半以上的纳入的研究(n = 28)仅有预印本。
我们担心存在偏倚和适用性的风险。常见的问题是使用多组设计(n = 29),仅纳入COVID-19病例(n = 19),未对指标测试的运用盲法(n = 49)和缺少参考标准(n = 29),差异验证(n = 22),和未对受试者人数,特征和研究排除标准加以明确(n = 47)。大多数研究(n = 44)仅纳入因疑似或确诊的COVID-19感染而住院的人。没有专门针对无症状者的研究。三分之二的研究(n = 33)仅根据RT-PCR结果确定了COVID-19病例,而忽略了RT-PCR结果假阴性的可能性。我们观察到通过删除测试的标识选择性发表研究结果(n = 5)的证据。
我们观察到,IgA,IgM和IgG抗体或其组合在症状出现后不同时间段的合并结果的敏感度方面存在很大的异质性(所有目标抗体的范围为0%至100%)。因此,我们综述对主要结果基于38项研究,这些研究按症状出现后的时间对结果进行分层。每周每个研究中提供资料的人数很少,且通常不是基于长期追踪同一组患者。
IgG、IgM、IgA、总抗体和IgG/IgM的合并结果在症状出现的第一周均显示低敏感度(均小于30.1%),在第二周上升,在第三周达到最高值。IgG/IgM组合1至7天的敏感度为30.1%(95%CI [21.4,40.7]),8至14天为72.2%(95%CI [63.5,79.5]),15至21天为91.4%(95%CI [87.0, 94.4])。对超过三周的准确性估计是基于较小的样本量和较少的研究。在21至35天中,IgG/IgM的合并敏感度为96.0%(95%CI [90.6,98.3])。没有足够的研究来评估症状出现后35天以上的测试敏感度。所有目标抗体的总体特异度(由35项研究提供)超过98%,置信区间宽度不超过2个百分点。在排除COVID-19疑似病例的情况下,假阳性结果较为常见,但数量不多,差异在偶然预期的范围内。
假设出现呼吸系统症状的医护人员的患病率为50%,我们预计在症状发生后15至21天接受IgG/IgM检测的1000人中,将有43人(28至65人)被漏检,7人(3至14人)呈假阳性。如果患病率为20%,即在高风险环境下的调查中可能出现的数值,每1000名受试者中会有17人(11至26人)被漏检,10人(5至22人)呈假阳性。在5%的较低患病率下,即全国调查中可能出现的值,每1000个测试中会有4例(3至7例)漏检,12例(6至27例)假阳性。
分析显示,不同检测类型之间的敏感度略有差异,但由于方法上的考虑和数据的稀少,使各检测品牌之间无法进行比较。
译者:赵洁,审校:刘旭,香港中文大学那打素护理学院。