هدف از انجام این مطالعه مروری چه بود؟
انواع مختلفی از سرطانهای خون وجود دارند که لوکمی (leukaemia) نامیده میشوند. لوکمی لنفوسیتیک مزمن (chronic lymphocytic leukaemia; CLL) شایعترین نوع آن است. بیستوپنج درصد از افرادی که به لوکمی مبتلا هستند، از CLL رنج میبرند. برای مبتلایان تازه تشخیص داده شده CLL و خانوادههای آنان، کاملا طبیعی است که بخواهند در مورد وضعیت سلامت خود در آینده مطلع باشند. ممکن است آنها بخواهند بدانند که نیازی به درمان خواهند داشت یا خیر و در چه زمانی، و اینکه بیماری آنها رو به وخامت خواهد رفت یا خیر و در چه زمانی، و این که با CLL چقدر زنده خواهند ماند.
پژوهشگران ویژگیهای متعددی را شناسایی کردند که با این پیامدها مرتبط هستند. با استفاده از این خصوصیات، آنها سعی کردهاند ابزاری را طراحی کنند که به پیشبینی آنچه ممکن است برای مبتلایان تازه تشخیص داده شده CLL اتفاق افتد، کمک کند.
هدف از این مرور کاکرین، ارزیابی و جمعبندی اطلاعات آن ابزار و مطالعاتی است که ابزار را با سایر دادههای بیمار میسنجند.
پیامهای کلیدی این مرور چه هستند؟
مرورگران دریافتند که هیچ روش قابلاطمینانی برای پیشبینی اتفاقاتی که ممکن است در طول زمان برای مبتلایان به CLL (درمان نشده) رخ دهد، وجود ندارد. یکی از دلایل این است که ابزار پیشبینی به تعداد دفعات کافی در طول زمان روی افراد مختلف آزمایش نشده تا بدانیم که آنها واقعا چقدر خوب کار میکنند.
دلیل دیگر این است که پژوهشگران همچنان در حال توسعه گزینههای درمانی موثرتری برای CLL هستند که نتایج بهتری داشته باشند، و ابزار پیشبینی، همگام با پیشرفتهای درمانی جلو نرفتهاند.
نتایج اصلی این مطالعه مروری چه هستند؟
ما 52 ابزار طراحی شده را برای پیشبینی آنچه که ممکن است در موارد تازه تشخیص داده شده لوکمی لنفوسیتیک مزمن رخ دهد، شناسایی کردیم. برای یافتن بهترین ابزار، مجبور شدیم که مطالعات را با دقت انتخاب کنیم. برای استفاده از این ابزار در عملکرد بالینی:
- یک ابزار باید توسط پژوهشگران مختلف آزمایش شود تا آنچه را که ممکن است در مبتلایان به CLL در مکانهای مختلف جغرافیایی با استفاده از گروههای مختلف افراد (یعنی سن، جنسیت، مرحله بدخیمی) مبتلا به CLL اتفاق افتد، پیشبینی کند. به عبارت دیگر، ابزاری را وارد نمیکنیم که فقط روی افرادی آزمایش شدهاند که دادههای آنان برای خلق آن ابزار بکار رفته است؛
- نتایج حاصل از ابزار باید پایدار و ثابت باشند تا کارآمدی آن اثبات شود؛
- آزمونهای انجام شده روی ابزار باید اطلاعات کافی را برای نشان دادن این که چقدر خوب کار میکند، ارائه دهند. به عنوان مثال، آزمونها باید شامل گروههای بزرگی از افراد و اطلاعات کافی در مورد نوع CLLای باشند که بیماران به آن مبتلا هستند.
ما سه ابزار را پیدا کردیم که این نیازها را برآورده کردند: شاخص بینالمللی پیشآگهی CLL؛ (CLL International Prognostic Index; CLL-IPI)، نمره بارسلونا-برنو (Barcelona-Brno)، و نمره شاخص MDACC 2007.
CLL-IPI بهترین کار را برای شناسایی مبتلایان به CLL که بیشتر زنده خواهند ماند و مبتلایانی که مدت زمان کمتری زنده خواهند ماند، انجام داد. با این حال، سطح کیفیت مطالعات CLL-IPI را پائین ارزیابی کردیم، زیرا آنها تمام اطلاعات لازم را برای دانستن میزان دقت این ابزار ارائه ندادند. نمره بارسلونا-برنو و نمره شاخص MDACC 2007، که روی تعداد کمتری از بیماران آزمایش شد، افتراق کمتری را بین بیمارانی با پیشآگهی خوب و بد نشان داد، و به طور مشابه، کیفیت پائین مطالعات را نشان داد.
نتیجهگیری
انجام پژوهشهای بیشتر و بهتری برای توسعه و آزمایش این دسته از ابزار مورد نیاز است تا به پیشبینی چگونگی رفتار CLL در گروههای مختلف افراد در طول زمان دست یابیم. ابزار همچنین باید به گونهای انطباق داده شوند که بتوانند کارآمدی درمانهای جدید را به دقت پیشبینی کنند.
با وجود تعداد فراوان مطالعات منتشر شده از مدلهای پیشآگهی برای بقای کلی، بقای بدون پیشرفت بیماری یا بقای بدون نیاز به درمان برای بزرگسالان تازه تشخیص داده شده مبتلا به CLL درمان نشده، فقط اقلیتی از آنها (12 مورد) برای پیامد اولیه مربوطه اعتبارسنجی خارجی شدهاند. سه مدل تحت اعتبارسنجی خارجی کافی برای امکانپذیر کردن متاآنالیز توانایی مدل در پیشبینی پیامدهای بقا قرار گرفتهاند. نبود گزارش، مانع از آن شد که طبق گایدلاین به خلاصه کردن کالیبراسیون بپردازیم. از میان سه مدل، CLL-IPI با وجود تخمین فراتر از آنچه باید، بهترین افتراق را نشان داد. با این حال، عملکرد مدل ممکن است برای افراد مبتلا به CLL که گزینههای درمانی پیشرفتهتر را دریافت کنند، تغییر کند، زیرا مدلهای موجود در این مرور بیشتر روی کوهورتهای گذشتهنگر آزمایش شدند که بیماران یک رژیم درمانی مرسوم را دریافت کرده بودند. نتیجهگیری آن که، این مرور به روشنی نیاز به بهبود روش انجام و گزارشدهی مطالعات توسعه مدل پیشآگهی و نیز مطالعات اعتبارسنجی خارجی را نشان میدهد. برای این که مدلهای پیشآگهی به عنوان ابزاری در عملکرد بالینی مورد استفاده قرار گیرند، توسعه مدلها (و مطالعات اعتبارسنجی متعاقب آنها) باید بتوانند آخرین گزینههای درمانی را با دقت پیشبینی عملکرد، مطابقت دهند. مطابقتها باید سر موقع انجام شوند.
لوکمی لنفوسیتیک مزمن (chronic lymphocytic leukaemia; CLL)، شایعترین نوع سرطان سیستم لنفاوی در کشورهای غربی است. چندین فاکتور بالینی و بیولوژیکی برای CLL شناسایی شدهاند. با این حال، هنوز مشخص نیست که کدام یک از مدلهای پیشآگهی موجود در ترکیب با این فاکتورها میتوانند در عملکرد بالینی برای پیشبینی پیامد طولانیمدت در موارد تازه تشخیص داده شده CLL مورد استفاده قرار گیرند.
شناسایی، توصیف و ارزیابی همه مدلهای پیشآگهی توسعه یافته برای پیشبینی بقای کلی (overall survival; OS)، بقای بدون پیشرفت (progression-free survival; PFS) بیماری یا بقای بدون نیاز به درمان (treatment-free survival; TFS) در بزرگسالان تازه تشخیص داده شده (قبلا درمان نشده) مبتلا به CLL، و متاآنالیز کارآمدی پیشبینی آنها.
ما در MEDLINE (از ژانویه 1950 تا جون 2019 از طریق Ovid)، Embase (از 1974 تا جون 2019) و پایگاههای ثبت کارآزماییهای در حال انجام (تا 5 مارچ 2020) برای یافتن مطالعات تکمیلی و اعتبارسنجی مدلهای پیشآگهی برای بزرگسالان درمان نشده مبتلا به CLL جستوجو کردیم. به علاوه، فهرست منابع و شاخصهای استناد را در مطالعات وارد شده غربالگری کردیم.
ما همه مدلهای پیشآگهی ایجاد شده را برای CLL که قادر به پیشبینی بقای کلی (OS)، بقای بدون پیشرفت بیماری (PFS) یا بقای بدون نیاز به درمان (TFS) بودند، به این شرط که فاکتورهای شناخته شده پیشآگهی را پیش از شروع درمان ترکیب کرده بودند، و نیز هر مطالعهای را که عملکرد این مدلها را در افرادی به جز آنهایی که در توسعه مدل شرکت داشتند، آزمایش کرد (یعنی «مطالعات اعتبارسنجی خارجی مدل»)، وارد کردیم. مطالعات انجام شده را روی بزرگسالان مبتلا به B-cell CLL با تشخیص قطعی که قبل از شروع مطالعه درمان نگرفته بودند، وارد کردیم. جستوجو را بر اساس طراحی مطالعه محدود نکردیم.
یک فرم استخراج داده را مطابق با Checklist for Critical Appraisal and Data Extraction for Systematic Reviews of Prediction Modelling Studies (CHARMS) تهیه کردیم. گروههای مستقل دو تایی از نویسندگان مرور، منابع را جستوجو، دادهها را استخراج و خطر سوگیری (bias) را مطابق با Prediction model Risk Of Bias ASsessment Tool (PROBAST) بررسی کردند. برای مدلهایی که حداقل سه مرتبه اعتبارسنجی خارجی شده بودند، هدف ما انجام یک متاآنالیز کمّی (quantitative) از پیشبینی عملکرد آنها بود، به ویژه کالیبراسیون آنها (نسبتی از افراد که پیشبینی شد دچار پیامد شوند و چنین شد) و افتراق (توانایی تمایز بین افراد با و بدون عارضه) با استفاده از یک مدل اثرات تصادفی. هنگامی که یک مدل افراد را به گروههای مختلف خطر طبقهبندی کرد، فراوانی پیامد را برای هر گروه خطر تجمیع کردیم (پائین، متوسط، بالا و بسیار بالا). درجهبندی توصیه، ارزیابی، توسعه و ارزشیابی (GRADE) را اعمال نکردیم، زیرا هنوز دستورالعملی برای مرورهای مدلهای پیشآگهی در دسترس نیست.
از 52 مطالعه واجد شرایط، 12 مدل اعتبارسنجی شده خارجی را شناسایی کردیم: شش مورد برای بقای کلی، یکی برای بقای بدون پیشرفت بیماری و پنج مورد برای بقای بدون نیاز به درمان. بهطور کلی، روش گزارشدهی مطالعات ضعیف بود، به ویژه معیارهای پیشبینی عملکرد برای کالیبراسیون و افتراق؛ همچنین، اطلاعات پایهای، مانند معیار واجد شرایط بودن و دوره ورود شرکتکنندگان، غالبا موجود نبودند. تقریبا همه مطالعات را بر اساس PROBAST، با خطر سوگیری (bias) بالا یا نامشخص قضاوت کردیم. بهطور کلی، قابلیت کاربرد مدلها و مطالعات اعتبارسنجی آنها کم یا نامشخص بود؛ شایعترین دلایل عبارت بودند از مدیریت نامناسب دادههای ازدسترفته و نقصهای جدی گزارشدهی در رابطه با معیار واجد شرایط بودن، دوره ورود، زمان مشاهده و معیارهای پیشبینی عملکرد.
نتایج را برای سه مدل پیشبینی کننده بقای کلی گزارش کردیم، که دادههای بیش از سه مطالعه اعتبارسنجی خارجی را در اختیار داشتند:
شاخص بینالمللی پیشآگهی CLL؛ (CLL-IPI)
این نمره شامل پنج فاکتور پیشآگهی است: سن، مرحله بالینی، وضعیت جهش IgHV؛ B2-میکروگلوبولین و وضعیت TP53. کالیبراسیون: برای گروههایی با خطر پائین، متوسط و بالا، بقای پنج ساله تجمعی به ازای هر گروه خطر از مطالعات اعتبارسنجی، با تواترهای مشاهده شده در مطالعه توسعه مدل مطابقت داشت. در گروه با خطر بالا، بقای پیشبینی شده از CLL-IPI کمتر از آنچه بود که در مطالعات اعتبارسنجی خارجی گزارش شد. افتراق: c-statistic تجمعی از هفت مطالعه اعتبارسنجی خارجی (3307 شرکتکننده، 917 عارضه) معادل 0.72 (95% فاصله اطمینان (CI)؛ 0.67 تا 0.77) گزارش شد. 95% فاصله پیشبینی (prediction interval; PI) این مدل برای آماره c، که فاصله مورد انتظار را برای توانایی افتراق مدل در یک مطالعه اعتبارسنجی خارجی جدید تعریف کرد، از 0.59 تا 0.83 متغیر بود.
نمره بارسلونا-برنو (Barcelona-Brno)
این نمره، با هدف ساده کردن CLL-IPI، شامل سه فاکتور پیشآگهی میشود: وضعیت جهش IgHV؛ del(17p) و del(11q). کالیبراسیون: برای گروهایی با خطر پائین و متوسط، بقای تجمعی در هر گروه خطر مطابق با تواترهای مشاهده شده در مطالعه توسعه مدل مطابقت داشت، اگرچه به نظر میرسد نمره برای گروه با خطر بالا، شانس بقا را فراتر از آنچه باید، تخمین زده است. افتراق: c-statistic تجمعی از چهار مطالعه اعتبارسنجی خارجی (1755 شرکتکننده، 416 عارضه) معادل 0.64 (95% CI؛ 0.60 تا 0.67)؛ 95% PI؛ 0.59 تا 0.68، بود.
نمره شاخص MDACC 2007
نویسندگان دو نسخه را از این مدل شامل شش فاکتور پیشآگهی برای پیشبینی بقای کلی ارائه دادند: سن، B2-میکروگلوبولین، تعداد مطلق لنفوسیتها، جنسیت، مرحله بالینی بیماری و تعداد گروههای لنفی. فقط یک مطالعه اعتبارسنجی برای نسخه جامعتر مدل در دسترس بود، یک فرمول با یک نوموگرام، در حالی که هفت مطالعه (5127 شرکتکننده، 994 عارضه) نسخه ساده مدل، نمره شاخص، را اعتبارسنجی کردند. کالیبراسیون: برای گروه با خطر پائین و متوسط، بقای تجمعی در هر گروه خطر مطابق با تواترهای مشاهده شده در مطالعه توسعه مدل مطابقت داشت، اگرچه به نظر میرسد نمره برای گروه پرخطر، شانس بقا را فراتر از آنچه باید، تخمین زده است. افتراق: c-statistic تجمعی از هفت مطالعه اعتبارسنجی خارجی برای نمره شاخص 0.65 (95% CI؛ 0.60 تا 0.70)؛ 95% PI؛ 0.51 تا 0.77، بود.
این متن توسط مرکز کاکرین ایران به فارسی ترجمه شده است.