چرا مطالعه مالتیپل اسکلروزیس مهم است؟
مالتیپل اسکلروزیس (multiple sclerosis; MS) یک بیماری مزمن در مغز، ستون فقرات، و اعصاب است. میلیونها نفر در سراسر جهان از این بیماری رنج میبرند، اما این بیماری و نحوه پیشرفت آن میتواند از فردی به فرد دیگر بسیار متفاوت باشد. اگرچه MS قابل درمان نیست، درمانهای مختلفی در دسترس هستند که میتوانند به کاهش نشانهها و کُند شدن روند بدتر شدن بیماری کمک کنند. این درمانها متفاوت عمل میکنند، و برخی از آنها عوارض جانبی شدیدتری نسبت به درمانهای دیگر دارند. درک شدت MS یک فرد برای بیماران و متخصصان پزشکی مهم است.
چرا مدلهای پیشآگهی در زمینه مالتیپل اسکلروزیس مهم هستند؟
مدلهای پیشآگهی به بیماران و متخصصان پزشکی کمک میکنند تا بفهمند یک فرد چقدر بیمار است و چقدر بیمار خواهد شد. این امر میتواند از بیماران در طول زندگی و انتخابهای درمانی آنها حمایت کند. مدلهای پیشآگهی همچنین میتوانند به متخصصان پزشکی کمک کنند تا در مورد نحوه بهترین درمان یک فرد، درک بهتر بیماری، یا توسعه درمانها، تصمیم بگیرند. مدلهای پیشآگهی MS ممکن است شامل ترکیب طیف وسیعی از اطلاعات مختلف در مورد یک فرد برای پیشبینی چگونگی ادامه پیشرفت MS باشند. اطلاعات مهمی که باید در یک مدل پیشآگهی گنجانده شوند، میتوانند برای مثال، اطلاعات مربوط به ویژگیهای شخصی (مانند سن، جنس، شاخص توده بدنی)، اطلاعات مربوط به رفتار آنها (مانند اینکه سیگار میکشند یا خیر) و اطلاعات مربوط به MS آنها (مانند مدت زمانی که این بیماری را داشتهاند) باشند. ویژگیهای بالینی یا معیارهای دیگر نیز ممکن است مهم باشند.
ما به دنبال چه یافتهای بودیم؟
هدف آن بود که انواعی را از مدلهای پیشآگهی جستوجو کرده و پیدا کنیم که اطلاعات متعددی را برای پیشبینی اینکه چگونه MS در بزرگسالان ادامه مییابد و بدتر میشود، ترکیب کردند.
ما چه کاری را انجام دادیم؟
از تکنیکهای مختلفی برای جستوجوی همه مطالعاتی که مدلهای پیشآگهی را توصیف کردند، استفاده کردیم، که چندین بخش از اطلاعات را که در زمینه MS توسعه یافتند، ترکیب کردند. به مطالعاتی که نشان دادند این مدلهای پیشآگهی چگونه توسعه یافتند، همچنین مطالعات مربوط به ارزیابی عملکرد واقعی آنها در بالین، علاقهمند بودیم. هنگامی که همه مطالعات مرتبط را پیدا کردیم، آنها را خلاصه کرده و ارزیابی کردیم که چقدر نتایج خود را به خوبی گزارش کردند و تا چه اندازه خوب انجام شدند.
ما به چه نتایجی رسیدیم؟
تعداد 57 مطالعه را پیدا کردیم که مدلهای پیشآگهی را توصیف کرده و چندین بخش از اطلاعات را برای پیشبینی اینکه چگونه MS در بزرگسالان ادامه مییابد و بدتر میشود، ترکیب کردند. این مطالعات توسعه 75 مدل مختلف پیشآگهی را توصیف کردند. تعداد 15 مورد وجود داشت که در آنها عملکرد مدلهای پیشآگهی خاص مورد ارزیابی قرار گرفتند.
به این نتیجه رسیدیم که مدلهای پیشآگهی بر پیامدهای متفاوتی تمرکز دارند؛ 41% به پیشرفت بیماری، 8% به عود، 18% به انتقال از اولین حمله به MS قطعی، و 28% به انتقال از مراحل اولیه MS به MS پیشرونده پرداختند. مدلهای پیشآگهی را که پیدا کردیم، از بسیاری جهات با یکدیگر بسیار متفاوت بودند. برای مثال، بیمارانی که برای توسعه این مدلها استفاده شدند، از نظر درمان بسیار متفاوت بودند. علاوه بر این، اطلاعاتی که برای پیشبینی دوره MS استفاده کردند، با یکدیگر تفاوت زیادی داشتند. متوجه شدیم که مدلهای پیشآگهی در طول زمان از نظر تشخیص MS و افزایش استفاده از درمان، اطلاعات مشاهده شده با تکنیکهای جدید، یا رویکردهای مدلسازی جدید، تغییر کردهاند. همچنین دریافتیم که استفاده از این مدلهای پیشآگهی به اطلاعاتی در مورد فرد نیاز دارد که به یک متخصص پزشکی و اغلب تجهیزات تخصصی نیاز دارد، که هر دو ممکن است در بسیاری از کلینیکها و بیمارستانها در دسترس نباشند.
محدودیتهای شواهد چه هستند؟
در اکثر مطالعات مشکلاتی را پیدا کردیم، به این معنی که ممکن است نتوانیم به نتایج آنها اعتماد داشته باشیم. مشکلات شایع شامل دادهها و روشهای آماری مورد استفاده در طول مطالعات بودند. علاوه بر این، بسیاری از مطالعات نتایجی را گزارش میکنند که اگر مدلهای پیشآگهی برای مجموعه جدیدی از افراد مبتلا به MS اعمال شوند، ممکن است بسیار متفاوت باشند. همچنین دریافتیم که مطالعات در توصیف روشها و گزارش یافتههای خود، روش ضعیفی داشتند.
این یافتهها به چه معنا است؟
مطالعاتی را که پیدا کردیم، نشان میدهند که شواهد مربوط به مدلهای پیشآگهی برای پیشبینی اینکه چگونه MS در بزرگسالان به پیشرفت و بدتر شدن ادامه میدهد، هنوز به خوبی توسعه نیافتهاند. انجام پژوهشهای جدیدی مورد نیاز است که بر استفاده از روشهای توصیه شده در دستورالعملهای بالینی برای توسعه مدلهای پیشآگهی و ارزیابی عملکرد آنها تمرکز کنند. این پژوهشها همچنین باید بر توصیف روشها و نتایج آنها به خوبی تمرکز کنند تا پژوهشگران و متخصصان پزشکی دیگر بتوانند از آنها برای پژوهش و عملکرد بالینی استفاده کنند.
شواهد فعلی برای توصیه به استفاده از هر یک از مدلهای پیشبینی پیشآگهی برای افراد مبتلا به MS در روتین بالینی امروزی، به دلیل عدم اعتبارسنجی خارجی مستقل، کافی نیست. جامعه پژوهشی پیشآگهی MS باید به گزارشهای فعلی و دستورالعملهای بالینی روششناسی (methodology) پایبند بوده و مطالعات زیادی را با اعتبارسنجی خارجی پیشرفتهتر، برای مدلهای موجود یا جدید توسعه یافته، انجام دهند.
مالتیپل اسکلروزیس (multiple sclerosis; MS) یک بیماری التهابی مزمن سیستم عصبی مرکزی است، که میلیونها نفر را در سراسر جهان تحت تاثیر قرار میدهد. سیر بیماری در افراد مختلف بسیار متفاوت است و اخیرا بسیاری از درمانهای تعدیل کننده بیماری با پروفایلهای بیخطری (safety) و اثربخشی متفاوتی ایجاد شدهاند. مدلهای پیشآگهی ارزیابی شده و معتبر نشان داده شده در محیطهای مختلف، پتانسیل حمایت از افراد مبتلا به MS و پزشکانشان را در طول فرآیند تصمیمگیری برای درمان یا مدیریت بیماری/زندگی دارند، امکان تفسیر طبقهبندی شده و دقیقتر کارآزماییهای مداخلهای را فراهم کرده، و بینشهایی را در مورد مکانیسم بیماری ارائه میدهند. بسیاری از پژوهشگران برای کمک به پیشبینی پیامدهای بالینی در افراد مبتلا به MS به مدلهای پیشآگهی روی آوردهاند؛ با این حال، طبق دانش فعلی، هنوز از هیچ مدل پیشآگهی پذیرفته شدهای برای MS در عملکرد بالینی استفاده نشده است.
شناسایی و خلاصه کردن مدلهای پیشآگهی چند متغیره، و مطالعات اعتبارسنجی آنها برای تعیین کمیّت خطر پیشرفت بالینی، بدتر شدن و فعالیت بیماری در بزرگسالان مبتلا به MS.
MEDLINE؛ Embase و بانک اطلاعاتی مرورهای سیستماتیک کاکرین (Cochrane Database of Systematic Reviews) را از ژانویه 1996 تا جولای 2021 جستوجو کردیم. همچنین فهرست منابع مطالعات وارد شده و مرورهای مرتبط، و منابعی را که به مطالعات وارد شده استناد کردند، غربالگری کردیم.
همه مدلهای پیشآگهی چند متغیره را که، با هدف پیشبینی پیشرفت بالینی، بدتر شدن و فعالیت بیماری، بر اساس ناتوانی، عود، تبدیل به MS قطعی، تبدیل به MS پیشرونده، یا ترکیبی از این موارد، در افراد بزرگسال مبتلا به MS، از نظر آماری توسعه یافتند، وارد کردیم. همچنین هر مطالعهای را در مورد ارزیابی عملکرد (یعنی اعتبارسنجی) این مدلها گنجاندیم. هیچ محدودیتی بر اساس زبان نگارش، منبع داده، زمانبندی پیشبینی یا زمانبندی پیامد وجود نداشت.
گروههای مستقل دو تایی از نویسندگان مرور، عناوین/چکیدهها و متون کامل را غربال کردند، دادهها را با استفاده از یک فرم آزمایشی بر اساس چک-لیست ارزیابی نقادانه و استخراج داده برای مرورهای سیستماتیک از مطالعات مدلسازی پیشبینی (Checklist for Critical Appraisal and Data Extraction for Systematic Reviews of Prediction Modelling Studies; CHARMS) استخراج کردند، خطر سوگیری (bias) را با استفاده از Prediction Model Risk Of Bias Assessment Tool (PROBAST)، و نقصهای گزارشدهی را بر اساس موارد چک-لیست در Transparent Reporting of a Multivariable Prediction Model for Individual Prognosis or Diagnosis (TRIPOD) مورد ارزیابی قرار دادند. ویژگیهای مدلهای گنجانده شده و اعتبارسنجی آنها به صورت نقل قول (narrative) شرح داده میشوند. قصد داشتیم که افتراق و کالیبراسیون مدلها را با حداقل سه تاییدیه خارجی بیرون از مطالعه توسعه مدل، متاآنالیز کنیم، اما هیچ مدلی با این معیار مطابقت نداشت. ناهمگونی میان-مطالعه را به صورت نقل قول خلاصه کردیم اما باز هم نتوانستیم متارگرسیون برنامهریزی شده را انجام دهیم.
تعداد 57 مطالعه را وارد کردیم که از میان آنها 75 مدل پیشرفت، 15 اعتبارسنجی خارجی مربوط به فقط 12 مدل (16%)، و شش اعتبارسنجی گزارش شده را توسط نویسنده شناسایی کردیم. فقط دو مدل چندین بار اعتبارسنجی خارجی شدند. هیچ یک از اعتبارسنجیهای خارجی شناسایی شده توسط پژوهشگران بهطور مستقل از کسانی که مدل را توسعه دادند، انجام نشد. این پیامد مربوط به پیشرفت بیماری در 39 مدل (41%)، عود در 8 مدل (8%)، تبدیل به MS قطعی در 17 مدل (18%)، و تبدیل به MS پیشرونده در 27 مدل (28%) از 96 مدل یا اعتبارسنجی بود. بیماری و ویژگیهای مرتبط با درمان شرکتکنندگان حاضر در مطالعات، و تعاریف پیشبینیکنندهها و پیامدهای در نظر گرفته شده، بین مطالعات بسیار ناهمگون بودند. بر اساس سال انتشار، شاهد افزایش درصد شرکتکنندگان در گروه درمان، تنوع معیارهای تشخیصی مورد استفاده، افزایش در نظر گرفتن بیومارکرها یا درمان به عنوان پیشبینیکنندهها و افزایش استفاده از روشهای یادگیری ماشینی در طول زمان بودیم.
قابلیت استفاده و تکرارپذیری
همه مدلهای شناسایی شده شامل حداقل یک پیشبینی کننده بودند که به مهارتهای یک متخصص پزشکی برای اندازهگیری یا ارزیابی نیاز داشتند. اکثر مدلها (44؛ 59%) حاوی پیشبینی کنندههایی با نیاز به تجهیزات تخصصی بودند که احتمالا در بخش مراقبتهای اولیه یا محیط استاندارد بیمارستان وجود نداشتند. بیش از نیمی (52%) از مدلهای توسعهیافته با ضرایب مدل، ابزار یا دستورالعملها همراه نبودند که مانع کاربرد، اعتبارسنجی مستقل یا تولید مجدد آنها میشود. دادههای مورد استفاده در توسعه مدل به صورت عمومی در دسترس قرار گرفتند یا گزارش شد که در صورت درخواست فقط در چند مطالعه (به ترتیب دو و شش) در دسترس بودند.
خطر سوگیری (bias)
همه پیشرفتها یا اعتبارسنجیهای مدل را به جز یک مورد، دارای خطر کلی بالای سوگیری رتبهبندی کردیم. دلیل اصلی این امر، روشهای آماری مورد استفاده برای توسعه یا ارزیابی مدلهای پیشآگهی بود؛ همه به جز دو مورد را از پیشرفتها یا اعتبارسنجیهای مدل گنجانده شده، دارای خطر بالای سوگیری در حوزه آنالیز رتبهبندی کردیم. هیچ یک از پیشرفتهای مدلی که اعتبارسنجی خارجی شدند یا اعتبارسنجی خارجی این مدلها، خطر پائین سوگیری نداشتند. در بیش از یک سوم (38%) از مدلها یا اعتبارسنجی آنها، نگرانی در رابطه با قابلیت کاربرد مدلها برای سوال پژوهشی ما وجود داشت.
گزارش نواقص
نحوه گزارشدهی بهطور کلی ضعیف بود و هیچ افزایش قابل مشاهدهای در کیفیت گزارشدهی در طول زمان مشاهده نشد. مواردی که برای اکثر مدلها یا اعتبارسنجیها بهطور نامشخص گزارش شده یا اصلا گزارش نشدند، مربوط به توجیه حجم نمونه، کورسازی (blinding) محققان ارزیابی کننده پیامد، جزئیات مدل کامل یا نحوه به دست آوردن پیشبینی از آن، مقدار دادههای ازدسترفته، و درمانهای دریافت شده توسط شرکتکنندگان بودند. ارائه گزارش از معیارهای عملکرد مدل ترجیحی از افتراق و کالیبراسیون، کمتر از حد مطلوب بود.
این متن توسط مرکز کاکرین ایران به فارسی ترجمه شده است.