ความเป็นมา
หนึ่งในมะเร็งชนิดที่พบได้บ่อยที่สุดคือมะเร็งลำไส้ใหญ่หรือมะเร็งลำไส้ใหญ่และทวารหนัก (CRC) การตรวจพบตั้งแต่เนิ่นๆ ก่อนที่อาการจะปรากฏ ช่วยให้รักษามะเร็งลำไส้ได้ง่ายขึ้นและเพิ่มโอกาสรอดชีวิต การเข้าร่วมโครงการตรวจคัดกรองมะเร็งลำไส้สามารถนำไปสู่การตรวจหาได้ตั้งแต่เนิ่นๆและกำจัดติ่งเนื้อขนาดใหญ่หรือขั้นสูง (advanced adenomas) ซึ่งถือว่าเป็นจุดเริ่มต้นของมะเร็งลำไส้ การตรวจอุจจาระอย่างง่ายใช้เพื่อตรวจหาเลือดในอุจจาระ ซึ่งอาจเป็นสัญญาณเริ่มต้นของมะเร็งลำไส้หรือติ่งเนื้อ การตรวจเลือดจากอุจจาระ 2 ประเภทที่ใช้ในการคัดกรองประชากร ได้แก่ การตรวจเลือดจากอุจจาระแบบ guaiac (gFOBT) และการทดสอบทางอิมมูโนเคมีในอุจจาระ (FITs) การศึกษาขนาดใหญ่และเก่าแสดงให้เห็นว่าการตรวจคัดกรองด้วย gFOBTs สามารถลดอัตราการเสียชีวิตได้ ในการทบทวนวรรณกรรมอย่างเป็นระบบ เราเปรียบเทียบความแม่นยำของการทดสอบทั้งสองนี้เพื่อประเมินว่าการทดสอบใดให้ผลลัพธ์ที่ดีที่สุดในการคัดกรองประชากรสำหรับมะเร็งลำไส้ และประการที่สอง สำหรับเนื้องอกขั้นลุกลาม (ซึ่งประกอบด้วยมะเร็งลำไส้และติ่งเนื้อขั้นสูงรวมกัน)
ลักษณะของการศึกษา
เราทำการค้นหาฐานข้อมูลออนไลน์โดยละเอียดสำหรับการศึกษาที่ประเมินหรือเปรียบเทียบ (หนึ่งใน) การทดสอบทั้งสองนี้ในการคัดกรอง CRC การทบทวนวรรณกรรมรวมเฉพาะการศึกษาในบุคคลที่มีความเสี่ยงปานกลางที่มีอายุมากกว่า 40 ปีและไม่มีอาการ มาตรฐานอ้างอิงเพื่อเปรียบเทียบผลการทดสอบคือการตรวจลำไส้ใหญ่ด้วยกล้องส่องผ่านทวารหนัก (colonoscopy) เราได้ทบทวนการศึกษา 2 ประเภท: การศึกษาที่ผู้เข้าร่วมทั้งหมดได้รับทั้งการทดสอบอุจจาระและการส่องกล้องตรวจลำไส้ใหญ่ และผู้เข้าร่วมที่มีผลการตรวจอุจจาระไม่ดีเท่านั้นที่ได้รับการตรวจลำไส้ใหญ่ (ในการศึกษาเหล่านี้ ผู้เข้าร่วมที่ไม่ได้ตรวจลำไส้ใหญ่หลังจากการตรวจอุจจาระได้รับการติดตามอย่างน้อยหนึ่งปีเพื่อดูว่าพวกเขาจะได้รับการวินิจฉัยว่าเป็นมะเร็งลำไส้ใหญ่หรือไม่) หลักฐานเป็นปัจจุบันถึงวันที่ 25 มิถุนายน 2019 เราดำเนินการค้นหาเพิ่มเติมในวันที่ 14 กันยายน 2021 ซึ่งให้การศึกษาที่อาจเข้าเกณฑ์เพียงการศึกษาเดียว ซึ่งกำลังรอการจัดประเภท
ลักษณะของการศึกษา
'ผู้คัดกรอง' โดย gFOBT - คือผู้ที่เข้าร่วมในการตรวจคัดกรอง - ได้รับคำสั่งให้เก็บตัวอย่างอุจจาระสองตัวอย่างจากการถ่ายอุจจาระติดต่อกันสามครั้งและให้ละเลงสิ่งนี้บนแผงตรวจอุจจาระ 6 อัน หากมีเลือดปนในอุจจาระ แผงจะเปลี่ยนสี จำนวนแผงที่เกิดสีที่จะทำการส่งต่อไปทำการส่องกล้องตรวจลำไส้ใหญ่แตกต่างกันไปตามโปรแกรมการตรวจคัดกรอง ในโปรแกรมส่วนใหญ่ แผงสีอันเดียวก็เพียงพอสำหรับการส่งต่อ อย่างไรก็ตาม ในบางพื้นที่ จำนวนแผงกำหนดไว้ที่ 5 ใน 6
ผู้เข้ารับการคัดกรอง FIT ได้รับคำแนะนำให้เก็บตัวอย่างอุจจาระจากการขับถ่ายครั้งเดียว และเก็บตัวอย่างนี้ด้วยแปรงหรือไม้พายลงในหลอด หลอดนี้จะถูกส่งไปยังห้องปฏิบัติการที่สามารถวัดความเข้มข้นของเลือดในอุจจาระได้ ขึ้นอยู่กับความสูงของความเข้มข้นนี้ สูงกว่าหรือต่ำกว่าจุดตัดหรือเกณฑ์ที่เรียกว่า cut-off หรือ threshold ผู้ถูกคัดกรองจะถูกส่งไปตรวจลำไส้ใหญ่ จุดตัดนี้แตกต่างกันไปตามโปรแกรมการคัดกรอง
ผลการศึกษาที่สำคัญ
เราวิเคราะห์การศึกษา 63 ฉบับ ซึ่งรวมบุคคลเกือบ 4 ล้านคน ผลของการทบทวนนี้บ่งชี้ว่า ตามทฤษฎีแล้วใน 10,000 คนที่เข้าร่วมในการคัดกรองด้วยการตรวจเลือดจากอุจจาระ และ 100 คนในกลุ่มนี้มี CRC:
- จาก 100 คนที่มี CRC จะพลาด 24 คนในการตรวจคัดกรองด้วย FIT
- จาก 100 คนที่มี CRC จะมี 61 คนที่พลาดถ้าตรวจคัดกรองด้วย gFOBT
เรายังดูผู้เข้าร่วมที่มีติ่งเนื้อขนาดใหญ่, CRC หรือทั้งสองอย่าง ถ้าตามทฤษฎีแล้ว มีคน 10,000 คนเข้าร่วมการตรวจคัดกรองด้วยการตรวจเลือดจากอุจจาระ และคน 1000 คนในกลุ่มนี้มีติ่งเนื้อขนาดใหญ่, CRC หรือทั้งสองอย่าง:
- จาก 1000 คนที่มีติ่งเนื้อขนาดใหญ่ CRC หรือทั้งสองอย่าง 850 คน จะพลาดถ้าตรวจด้วย gFOBT
- จาก 1000 คนที่มีติ่งเนื้อขนาดใหญ่ CRC หรือทั้งสองอย่าง 670 คนจะพลาดในการตรวจคัดกรองด้วย FIT
ในกลุ่มผู้คัดกรองทางทฤษฎี 10,000 คน:
- 594 คนที่ได้รับการตรวจคัดกรองด้วย FIT จะได้รับการเสนอการส่องกล้องตรวจลำไส้ใหญ่ที่ 'ไม่จำเป็น' ซึ่งไม่จำเป็นเพราะพวกเขาไม่มี CRC และ
- 594 คนที่ได้รับการตรวจคัดกรองด้วย gFOBTs จะได้รับการเสนอการส่องกล้องตรวจลำไส้ใหญ่ที่ 'ไม่จำเป็น'
จากผลลัพธ์ที่อธิบายไว้ข้างต้น เราจะเห็นว่า FIT พลาด CRC น้อยกว่า gFOBT ในขณะที่ผู้เข้ารับการตรวจเลือดแต่ละประเภทในจำนวนเท่าๆ กันต้องได้รับการส่องกล้องตรวจลำไส้ใหญ่โดยไม่จำเป็น
ผลการศึกษาในการทบทวนนี้เชื่อถือได้เพียงใด
ผลการศึกษามีความน่าเชื่อถือ เนื่องจากการศึกษาที่รวบรวมส่วนใหญ่ตรงตามเกณฑ์คุณภาพที่เราระบุไว้ก่อนเริ่มการทบทวน
การวิจัยในอนาคต
จำเป็นต้องมีการวิจัยเพิ่มเติมเพื่อตรวจสอบว่าในระยะยาวการตรวจคัดกรอง FIT สามารถลดจำนวนผู้ป่วยมะเร็งลำไส้และการเสียชีวิตได้หรือไม่ และเพื่อเปรียบเทียบสิ่งที่ค้นพบเหล่านี้กับการตรวจคัดกรอง gFOBT
FIT เหนือกว่า gFOBT ในการตรวจหา AN และ CRC ในบุคคลที่มีความเสี่ยงปานกลาง ความจำเพาะของการทดสอบทั้งสองมีความคล้ายคลึงกันในการศึกษา "มาตรฐานอ้างอิง: ทั้งหมด" ในขณะที่ความจำเพาะสำหรับ gFOBTs สูงกว่า FIT ในการศึกษา "มาตรฐานอ้างอิง: บวก" อย่างมีนัยสำคัญ อย่างไรก็ตาม ที่ตามความจำเพาะที่กำหนดไว้ล่วงหน้า ความไวของ FIT นั้นสูงกว่า gFOBT อย่างมีนัยสำคัญ
ทั่วโลก หลายประเทศได้ใช้โปรแกรมการตรวจคัดกรองมะเร็งลำไส้ใหญ่และทวารหนัก (CRC) ซึ่งมักใช้การตรวจหาเลือดในอุจจาระ (FOBTs) การตรวจคัดกรอง CRC มีจุดมุ่งหมายเพื่อตรวจหาเนื้องอกขั้นลุกลาม (AN) ซึ่งกำหนดเป็น CRC หรือ advanced adenomas FOBT แบ่งออกเป็น 2 ประเภทตามเทคนิคการตรวจจับและส่วนประกอบของเลือดที่ตรวจพบ: FOBTs การตรวจเชิงคุณภาพที่ใช้ guaiac (FOBTs, gFOBT) และการทดสอบอิมมูโนเคมีในอุจจาระ (FITs) ซึ่งสามารถตรวจทั้งเชิงคุณภาพและเชิงปริมาณ การตรวจคัดกรองด้วย gFOBTs ช่วยลดการเสียชีวิตจาก CRC
เพื่อเปรียบเทียบความแม่นยำในการตรวจวินิจฉัยของการตรวจคัดกรองด้วย gFOBT และ FIT สำหรับการตรวจหาเนื้องอกลำไส้ใหญ่และทวารหนักระยะลุกลามในบุคคลที่มีความเสี่ยงปานกลาง
เราค้นหา CENTRAL, MEDLINE, Embase, BIOSIS Citation Index, Science Citation Index Expanded และ Google Scholar เราค้นหารายการอ้างอิงและบทความที่เกี่ยวข้องกับ PubMed ของการศึกษาที่รวบรวมเพื่อค้นหาการศึกษาเพิ่มเติม
เรารวมการศึกษาแบบไปข้างหน้าและย้อนหลังที่ให้จำนวนของผลบวกจริง ผลบวกลวง ผลลบลวง และผลลบจริงสำหรับ gFOBTs, FIT หรือทั้งสองอย่าง โดยมีการส่องกล้องตรวจลำไส้ใหญ่เป็นมาตรฐานอ้างอิง เราไม่รวมการศึกษาแบบ case-control เรารวมการศึกษาที่ผู้เข้าร่วมทั้งหมดได้ทั้งการทดสอบดัชนีและมาตรฐานอ้างอิง ("มาตรฐานอ้างอิง: ทั้งหมด") และการศึกษาที่ผู้เข้าร่วมที่มีการทดสอบดัชนีได้ผลบวกเท่านั้นที่ได้รับการตรวจด้วยการทดสอบที่เป็นมาตรฐานอ้างอิง ในขณะที่ผู้เข้าร่วมที่มีการทดสอบดัชนีเป็นลบได้รับการติดตามอย่างน้อยหนึ่งปีสำหรับการหาการเกิดมะเร็ง ("มาตรฐานอ้างอิง: บวก") ประชากรเป้าหมายประกอบด้วยบุคคลที่ไม่มีอาการและมีความเสี่ยงปานกลางซึ่งได้รับการตรวจคัดกรอง CRC ภาวะเป้าหมายคือ CRC และเนื้องอกขั้นสูง (advanced adenomas และ CRC รวมกัน)
ผู้ประพันธ์การทบทวนสองคนคัดกรองการศึกษาเพื่อนำเข้าและคัดลอกข้อมูลอย่างอิสระต่อกัน ในกรณีที่ไม่เห็นด้วย ให้ปรึกษาผู้ประพันธ์การทบทวนวรรณกรรมคนที่ 3 ตัดสินเป็นที่สิ้นสุด เราใช้แบบจำลองลักษณะการทำงานของเครื่องรับข้อมูลสรุปแบบลำดับชั้นของ Rutter และ Gatsonis เพื่อสำรวจความแตกต่างระหว่างการทดสอบและระบุแหล่งที่มาที่เป็นไปได้ของความแตกต่าง และแบบจำลองลำดับชั้น bivariate เพื่อประเมินความไวและความจำเพาะที่เกณฑ์ทั่วไป: 10 µg haemoglobin (Hb)/g faeces และ 20 µg Hb/g faeces เราทำการเปรียบเทียบทางอ้อมของความแม่นยำของการทดสอบทั้งสองและการเปรียบเทียบโดยตรงเมื่อการทดสอบดัชนีทั้งสองได้รับการประเมินในประชากรเดียวกัน
เราดำเนินการค้นหาครั้งแรกเมื่อวันที่ 25 มิถุนายน 2019 ซึ่งมีการศึกษา 63 ฉบับที่รวบรวมไว้ เราดำเนินการค้นหาเพิ่มเติมในวันที่ 14 กันยายน 2021 ซึ่งพบการศึกษาที่อาจเข้าเกณฑ์ 1 ฉบับ ซึ่งกำลังรอการจัดหมวดหมู่
เรารวมบทความที่ตีพิมพ์ "มาตรฐานอ้างอิง: ทั้งหมด" 33 บทความที่มีผู้เข้าร่วม 104,640 คน การศึกษา 6 ฉบับที่ประเมินเฉพาะ gFOBTs การศึกษา 23 ฉบับ ที่ประเมินเฉพาะ FIT และการศึกษา 4 ฉบับ ประเมินทั้ง gFOBT และ FIT จุดตัดสำหรับผลบวกของ FIT แตกต่างกันระหว่าง 2.4 μg และ 50 µg Hb/g faeces สำหรับแต่ละโดเมนการประเมินคุณภาพของการศึกษาความแม่นยำของการวินิจฉัย (QUADAS)-2 เราประเมินความเสี่ยงของอคติเป็นสูงในน้อยกว่า 20% ของการศึกษา กราฟสรุปแสดงให้เห็นว่า FIT มีความสามารถในการจำแนกสูงกว่า gFOBT สำหรับ AN (P < 0.001) และ CRC (P = 0.004) สำหรับการตรวจหา AN ความไวสรุปของ gFOBT คือ 15% (ช่วงความเชื่อมั่น 95% (CI) 12% ถึง 20%) ซึ่งต่ำกว่า FIT อย่างมีนัยสำคัญที่จุดตัดทั้ง 10 μg และ 20 μg Hb/g ด้วยข้อมูลสรุป ความไว 33% (95% CI 27% ถึง 40%; P < 0.001) และ 26% (95% CI 21% ถึง 31%, P = 0.002) ตามลำดับ ผลลัพธ์ถูกจำลองในกลุ่มตัวอย่างสมมุติของผู้เข้าร่วมการตรวจคัดกรอง 10,000 คนที่มีความชุกของ CRC 1% และความชุกของ AN 10% จากผู้เข้าร่วม 1000 รายที่มี AN, gFOBT พลาด 850 ในขณะที่ FIT พลาด 670 (ที่จุดตัด 10 μg Hb/g) และ 740 (ที่จุดตัด 20 μg Hb/g) ไม่พบความแตกต่างที่มีนัยสำคัญในความจำเพาะโดยสรุปสำหรับการตรวจหา AN ระหว่าง gFOBT (94%; 95% CI 92% ถึง 96%) และ FIT ที่จุดตัด 10 μg Hb/g (93%; 95% CI 90% ถึง 95% ) และที่จุดตัด 20 μg Hb/g (97%; 95% CI 95% ถึง 98%) ดังนั้น ในบรรดาผู้เข้าร่วม 9000 คนที่ไม่มี AN จึงมี 540 คนได้รับการตรวจลำไส้ใหญ่ (โดยไม่จำเป็น) ด้วย gFOBT เทียบกับ 630 (10 μg Hb/g) และ 270 (20 μg Hb/g) ด้วยการตรวจ FIT ในทำนองเดียวกัน สำหรับการตรวจหา CRC ความไวสรุปของ gFOBTs 39% (95% CI 25% ถึง 55%) ต่ำกว่า FIT อย่างมีนัยสำคัญที่จุดตัด 10 μg และ 20 μg Hb/g: 76% (95% CI 57% ถึง 88%: P = 0.001) และ 65% (95% CI 46% ถึง 80%; P = 0.035) ตามลำดับ ดังนั้น จากผู้เข้าร่วม 100 คนที่เป็น CRC, gFOBT พลาด 61 และ FIT พลาด 24 (10 μg Hb/g) และ 35 (20 μg Hb/g) ไม่พบความแตกต่างที่มีนัยสำคัญในความจำเพาะโดยสรุปสำหรับ CRC ระหว่าง gFOBTs (94%; 95% CI 91% ถึง 96%) และ FIT ที่จุดตัด 10 μg Hb/g (94%; 95% CI 87% ถึง 97% ) และที่จุดตัด 20 μg Hb/g (96%; 95% CI 91% ถึง 98%) ดังนั้น จากผู้เข้าร่วม 9900 คนที่ไม่มี CRC จึงมี 594 คนได้รับการตรวจลำไส้ใหญ่ (โดยไม่จำเป็น) ด้วย gFOBTs เทียบกับ 594 (10 μg Hb/g) และ 396 (20 μg Hb/g) ด้วย FIT
ในการศึกษา 5 ฉบับที่เปรียบเทียบ FITs และ gFOBTs ในประชากรเดียวกัน FITs แสดงความสามารถในการตรวจหา AN ที่สูงกว่า gFOBTs (P = 0.003)
เรารวมการศึกษา "มาตรฐานอ้างอิง: ผลบวก" ทั้งหมด 30 เรื่อง ซึ่งมีผู้เข้าร่วม 3,664,934 คน ในจำนวนนี้ มีการศึกษา 8 ฉบับ เป็นการศึกษาเฉพาะ gFOBT มีการศึกษา 18 ฉบับเป็นการศึกษาเฉพาะ FIT และ มีการศึกษา 4 ฉบับ รวมกันทั้ง gFOBT และ FIT จุดตัดสำหรับผลบวกของ FIT แตกต่างกันระหว่าง 5 µg และ 250 µg Hb/g faeces สำหรับแต่ละโดเมนของ QUADAS-2 เราประเมินความเสี่ยงของการมีอคติสูงในน้อยกว่า 20% ของการศึกษา กราฟสรุปแสดงให้เห็นว่า FIT มีความสามารถในการแยกแยะที่สูงกว่าสำหรับการตรวจหา CRC มากกว่า gFOBT (P < 0.001) ความไวสรุปสำหรับ CRC ของ gFOBTs, 59% (95% CI 55% ถึง 64%) ต่ำกว่า FIT อย่างมีนัยสำคัญที่จุดตัด 10 μg Hb/g, 89% (95% CI 80% ถึง 95%; P < 0.001) และจุดตัด 20 μg Hb/g, 89% (95% CI 85% ถึง 92%; P < 0.001) ดังนั้น ในกลุ่มตัวอย่างสมมุติที่มีผู้เข้าร่วม 100 คนที่มี CRC พบว่า gFOBT พลาด 41 คน ในขณะที่ FIT พลาด 11 คน (10 μg Hb/g) และ 11 คน (20 μg Hb/g) ความจำเพาะโดยสรุปของ gFOBT คือ 98% (95% CI 98% ถึง 99%) ซึ่งสูงกว่า FIT ที่จุดตัดทั้ง 10 μg และ 20 μg Hb/g: 94% (95% CI 92% ถึง 95%; P < 0.001) และ 95% (95% CI 94% ถึง 96%; P < 0.001) ตามลำดับ ดังนั้น จากผู้เข้าร่วม 9900 คนที่ไม่มี CRC จึงมี 198 คนได้รับการตรวจลำไส้ใหญ่ (โดยไม่จำเป็น) ด้วย gFOBT เทียบกับ 594 (10 μg Hb/g) และ 495 (20 μg Hb/g) ด้วย FIT ที่ความจำเพาะ 90% และ 95% FIT มีความไวสูงกว่า gFOBT
โแปลโดย ศ.นพ.ภิเศก ลุมพิกานนท์ ภาควิชาสูติศาสตร์และนรีเวชวิทยา คณะแพทยศาสตร์ มหาวิทยาลัยขอนแก่น 30 ธันวาคม 2022 Edit โดย ผกากรอง 3 กุมภาพันธ์ 2023