¿En qué medida predicen bien las herramientas lo que sucede con los pacientes adultos con leucemia linfocítica crónica (LLC) recién diagnosticada a lo largo del tiempo?

¿Cuál era el objetivo de esta revisión?

Hay muchos tipos de cáncer de la sangre llamados leucemia. La leucemia linfocítica crónica (LLC) es el tipo más común. El 25% de los pacientes que presentan leucemia tienen LLC. Es natural que los pacientes con LLC recién diagnosticada y sus familias quieran saber qué pasará con su salud en el futuro. Tal vez se pregunten si necesitarán tratamiento o cuándo, si su enfermedad empeorará o cuándo, o cuánto tiempo viven las personas con LLC.

Los investigadores identificaron varias características que se asocian con estos desenlaces. A partir de estas características, han tratado de diseñar herramientas que ayuden a predecir lo que puede suceder a grupos de pacientes con LLC recién diagnosticada.

El objetivo de esta revisión Cochrane es evaluar y resumir las herramientas y estudios que prueban las herramientas con otros datos de pacientes.

¿Cuáles son los mensajes clave de esta revisión?

Los autores de la revisión encontraron que no hay una manera confiable de predecir lo que podría suceder con el tiempo a los pacientes con LLC (no tratada). Una razón es que las herramientas de predicción no se han probado suficientes veces con suficientes pacientes diferentes para saber en qué medida funcionan bien realmente.

Otra razón es que los investigadores continúan desarrollando opciones de tratamiento de la LLC más efectivas que tienen mejores resultados, y las herramientas de predicción no se han ido actualizando con los avances en el tratamiento.

¿Cuáles son los principales resultados de la revisión?

Se identificaron 52 herramientas que fueron diseñadas para predecir lo que puede suceder a los pacientes recién diagnosticados con LLC. Para encontrar las mejores herramientas hubo que seleccionar los estudios cuidadosamente. Para aplicar estas herramientas en la práctica clínica:

- una herramienta debe ser probada por diferentes investigadores para predecir lo que puede suceder a los individuos con LLC en diferentes lugares geográficos utilizando diferentes grupos de pacientes (es decir, edad, género, estadio) con LLC. En otras palabras, no se incluiría una herramienta si sólo se hubiera probado en los pacientes que proporcionaron sus datos para crearla;

- los resultados de la herramienta deben ser consistentes para probar que funciona;

- las pruebas de la herramienta deben proporcionar suficiente información para mostrar lo bien que funciona la herramienta. Por ejemplo, las pruebas deben incluir grandes grupos de pacientes y suficiente información sobre el tipo de LLC que presentan.

Se encontraron tres herramientas que cumplían con estos requisitos: el CLL International Prognostic Index (CLL-IPI), la puntuación Barcelona-Brno y la puntuación del índice MDACC 2007.

El CLL-IPI funcionó mejor para identificar a los pacientes que sobrevivirían más tiempo con LLC y a los que sobrevivirían menos tiempo. Sin embargo, la calidad de los estudios del CLL-IPI se consideró baja porque no proporcionaron toda la información necesaria para saber cuán precisa era la herramienta. La puntuación Barcelona-Brno y la puntuación del índice MDACC 2007, se probaron en un número general más pequeño de pacientes, mostraron una menor discriminación entre los pacientes con un buen pronóstico en comparación con un peor pronóstico, y los estudios mostraron una calidad similarmente baja.

Conclusión

Se necesitan más y mejores estudios de investigación para desarrollar y probar las herramientas que ayuden a predecir cómo se comportará la LLC en diferentes grupos de pacientes a lo largo del tiempo. Las herramientas también se deben adaptar para predecir con precisión el rendimiento de los nuevos tratamientos.

Conclusiones de los autores: 

A pesar del gran número de estudios publicados sobre modelos de pronóstico para la SG, la SSP o la SST en los pacientes adultos recién diagnosticados y no tratados con LLC, sólo una minoría de éstos (n = 12) se han validado externamente para su respectivo desenlace primario. Tres modelos han sido objeto de una validación externa suficiente para permitir el metanálisis de la capacidad del modelo para predecir los desenlaces de supervivencia. La falta de informes impidió resumir la calibración según lo recomendado. De los tres modelos, el CLL-IPI muestra la mejor discriminación, a pesar de la sobrestimación. Sin embargo, el rendimiento de los modelos puede cambiar en los individuos con LLC que reciben mejores opciones de tratamiento, ya que los modelos incluidos en esta revisión se probaron principalmente en cohortes retrospectivas que recibían un régimen de tratamiento tradicional. En conclusión, esta revisión muestra una clara necesidad de mejorar la realización y la presentación de informes, tanto del desarrollo de modelos pronósticos como de los estudios de validación externa. Para que los modelos de pronóstico se utilicen como herramientas en la práctica clínica, el desarrollo de los modelos (y sus posteriores estudios de validación) se debe adaptar para incluir las últimas opciones de tratamiento para predecir con precisión el rendimiento. Las adaptaciones se deben realizar de forma oportuna.

Leer el resumen completo…
Antecedentes: 

La leucemia linfocítica crónica (LLC) es el cáncer más común del sistema linfático en los países occidentales. Se han identificado varios factores clínicos y biológicos para la LLC. Sin embargo, sigue sin estar claro cuál de los modelos pronósticos disponibles que combinan esos factores se puede utilizar en la práctica clínica para predecir el desenlace a largo plazo de los pacientes recién diagnosticados con LLC.

Objetivos: 

Identificar, describir y evaluar todos los modelos pronósticos desarrollados para predecir la supervivencia global (SG), la supervivencia sin progresión (SSP) o la supervivencia sin tratamiento (SST) en pacientes adultos recién diagnosticados con LLC (previamente no tratados), y metanalizar sus rendimientos predictivos.

Métodos de búsqueda: 

Se realizaron búsquedas en MEDLINE (desde enero de 1950 hasta junio de 2019 vía Ovid), Embase (desde 1974 hasta junio de 2019) y en los registros de ensayos en curso (hasta el 5 de marzo de 2020) para obtener estudios de desarrollo y validación de modelos pronósticos en pacientes adultos con LLC no tratados. Además, se examinaron las listas de referencias y los índices de citas de los estudios incluidos.

Criterios de selección: 

Se incluyeron todos los modelos pronósticos desarrollados para la LLC que predicen la SG, la SSP o la SST, siempre que combinaran los factores pronósticos conocidos antes del inicio del tratamiento, y cualquier estudio que probara el rendimiento de estos modelos en individuos distintos de los incluidos en el desarrollo del modelo (es decir, "estudios de validación de modelos externos"). Se incluyeron los estudios en adultos con LLC de células B confirmada que no habían recibido tratamiento antes del comienzo del estudio. No se restringió la búsqueda en base al diseño del estudio.

Obtención y análisis de los datos: 

Se desarrolló un formulario de extracción de datos para recopilar información basada en la Checklist for Critical Appraisal and Data Extraction for Systematic Reviews of Prediction Modelling Studies (CHARMS). Pares independientes de autores de la revisión examinaron las referencias, extrajeron los datos y evaluaron el riesgo de sesgo de acuerdo con el Prediction model Risk Of Bias ASsessment Tool (PROBAST). En el caso de los modelos que se validaron externamente por lo menos tres veces, se trató de realizar un metanálisis cuantitativo de su rendimiento predictivo, en particular su calibración (proporción de pacientes en los que se pronostica el desenlace y que lo presentan) y la discriminación (capacidad de diferenciar entre los pacientes con y sin el evento) con el uso de un modelo de efectos aleatorios. Cuando un modelo clasificó a los individuos en categorías de riesgo, las frecuencias de desenlaces se agruparon por grupo de riesgo (bajo, intermedio, alto y muy alto). No se aplicó GRADE, ya que aún no se dispone de guías para la revisión de los modelos pronósticos.

Resultados principales: 

De 52 estudios elegibles, se identificaron 12 modelos validados externamente: seis se desarrollaron para la SG, uno para la SSP y cinco para SST. En general, los informes de los estudios fueron deficientes, especialmente con respecto a las medidas de rendimiento predictivo para la calibración y la discriminación; pero también faltó información básica, como los criterios de elegibilidad y el período de reclutamiento de los participantes. Casi todos los estudios se consideraron con riesgo alto o incierto de sesgo según PROBAST. En general, la aplicabilidad de los modelos y sus estudios de validación fue baja o poco clara; las razones más comunes fueron el procesamiento inadecuado de los datos faltantes y las graves deficiencias en la presentación de los informes sobre los criterios de elegibilidad, el período de reclutamiento, el tiempo de observación y las medidas de rendimiento de las predicciones.

Se informaron los resultados de tres modelos que predicen la SG, que tenían datos disponibles de más de tres estudios de validación externos:

CLL International Prognostic Index (CLL-IPI)

Esta puntuación incluye cinco factores pronósticos: edad, estadio clínico, estado de mutación del IgHV, concentración de la B2-microglobulina y estado del TP53. Calibración: en el caso de los grupos de riesgo bajo, intermedio y alto, la supervivencia agrupada a los cinco años por grupo de riesgo de los estudios de validación correspondió a las frecuencias observadas en el estudio de desarrollo de modelos. En el grupo de muy alto riesgo, la supervivencia prevista del CLL-IPI fue menor que la observada en los estudios de validación externos. Discriminación: la estadística c agrupada de siete estudios de validación externa (3307 participantes, 917 eventos) fue 0,72 (intervalo de confianza [IC] del 95%: 0,67 a 0,77). El intervalo de predicción (IP) del 95% de este modelo para la estadística c, que describe el intervalo esperado para la capacidad de discriminación del modelo en un nuevo estudio de validación externo, varió entre 0,59 y 0,83.

Puntuación Barcelona-Brno

Con el objetivo de simplificar el CLL-IPI, esta puntuación incluye tres factores pronósticos: estado de mutación del IgHV, del(17p) y del(11q). Calibración: para el grupo de riesgo bajo e intermedio, la supervivencia agrupada por grupo de riesgo correspondió a las frecuencias observadas en el estudio de desarrollo de modelos, aunque la puntuación parece sobrestimar la supervivencia para el grupo de alto riesgo. Discriminación: la estadística c agrupada de cuatro estudios de validación externa (1755 participantes, 416 eventos) fue 0,64 (IC del 95%: 0,60 a 0,67); IP del 95%: 0,59 a 0,68.

Puntuación del índice MDACC 2007

Los autores presentaron dos versiones de este modelo que incluyen seis factores pronósticos para predecir la SG: edad, B2-microglobulina, recuento absoluto de linfocitos, sexo, estadio clínico y número de grupos ganglionares. Sólo se disponía de un estudio de validación para la versión más completa del modelo, una fórmula con un nomograma, mientras que siete estudios (5127 participantes, 994 eventos) validaron la versión simplificada del modelo, la puntuación del índice. Calibración: para los grupos de riesgo bajo e intermedio, la supervivencia agrupada por grupo de riesgo correspondió a las frecuencias observadas en el estudio de desarrollo de modelos, aunque la puntuación parece sobrestimar la supervivencia para el grupo de alto riesgo. Discriminación: la estadística c agrupada de los siete estudios de validación externa para la puntuación del índice fue 0,65 (IC del 95%: 0,60 a 0,70); IP del 95%: 0,51 a 0,77.

Notas de traducción: 

La traducción de las revisiones Cochrane ha sido realizada bajo la responsabilidad del Centro Cochrane Iberoamericano, gracias a la suscripción efectuada por el Ministerio de Sanidad del Gobierno de España. Si detecta algún problema con la traducción, por favor, contacte con comunica@cochrane.es.

Tools
Information