¿Hasta qué punto son precisos la puntuación FIB-4 y el índice de Forns (pruebas no invasivas) para diagnosticar los estadios de fibrosis hepática en adultos con hepatitis C crónica?

Mensajes clave

• Tanto la puntuación FIB-4 como el índice de Forns se pueden utilizar en la fase inicial de la investigación para determinar si la persona tiene fibrosis hepáticas.

• Lo mejor es utilizar la puntuación FIB-4 para descartar el estadio 3 (fibrosis grave) o el estadio 4 (cirrosis).

• Es mejor utilizar el índice de Forns para diagnosticar a las personas con estadio 2 (fibrosis significativa).

¿Por qué es importante mejorar el diagnóstico de las fibrosis hepáticas?

La infección por hepatitis C es una causa frecuente de cicatrización del hígado (fibrosis hepática). Si no se trata, puede evolucionar a una forma grave denominada cirrosis hepática, que en la mayoría de los casos es irreversible y puede provocar que el hígado deje de funcionar o presente cáncer. Actualmente, la mejor prueba para diagnosticar la fibrosis hepática es la biopsia hepática, en la que se extrae tejido hepático con una aguja y se observa al microscopio. Sin embargo, la biopsia hepática es invasiva, costosa, dolorosa y conlleva algunos riesgos graves, como hemorragias. El diagnóstico exacto de la fibrosis hepática mediante pruebas no invasivas como la puntuación FIB-4 y el índice de Forns beneficiaría a las personas y a los sistemas sanitarios en general. Sin embargo, su exactitud diagnóstica (es decir, su capacidad para indicar qué personas padecen qué estadio de la enfermedad) en personas infectadas por el virus de la hepatitis C todavía es incierta.

¿Qué son las pruebas índice puntuación FIB-4 e índice de Forns?

La puntuación FIB-4 y el índice de Forns son pruebas para diagnosticar los estadios de fibrosis hepática. Combinan resultados estándar de laboratorio con factores como la edad para calcular una puntuación que determina la cantidad de cicatrices en el hígado. En comparación con la biopsia hepática, son de pruebas sencillas, baratas, ampliamente disponibles, relativamente indoloras y sin riesgos.

Cada prueba tiene dos valores de corte: alto / confirmación y bajo / descarte. Si el resultado de una persona está por debajo del valor de corte bajo, no tiene ese estadio de fibrosis. Si el resultado de una persona está por encima del valor de corte alto, significa que tiene ese estadio de fibrosis. Si la puntuación de una persona se encuentra entre los dos valores de corte, la prueba no es útil porque no puede ni confirmar ni descartar la fibrosis. Es lo que se denomina "zona gris". Las personas con una puntuación en la "zona gris" deben someterse a más pruebas, como una biopsia hepática.

¿Qué se quiso averiguar?

Se quería determinar hasta qué punto la puntuación FIB-4 y el índice de Forns pueden diagnosticar diferentes estadios de fibrosis hepática en personas con hepatitis C crónica, en comparación con los resultados de la biopsia hepática.

¿Qué se hizo?

Se buscaron estudios que evaluaran la exactitud diagnóstica de la puntuación FIB-4 o el índice de Forns (o ambos) en personas con hepatitis C y se combinaron los resultados de estos estudios.

¿Qué se encontró?

Se incluyeron 84 estudios con un total de 107 583 participantes. Los estudios se realizaron en 28 países y se publicaron entre 2002 y 2021. Se analizaron los resultados de 62 estudios con 100 605 participantes. Se seleccionó esta parte de los estudios porque aplicaron las dos pruebas utilizando valores de corte bajos y altos comparables. Este enfoque permite confiar más en los resultados del análisis.

Al combinar los resultados de los estudios sobre la puntuación FIB-4 para el diagnóstico de la fibrosis grave (estadio 3), se puede afirmar lo siguiente para un grupo hipotético de 1000 personas:

• con el valor de corte alto o de "confirmación", 144 personas serían diagnosticadas correctamente de fibrosis grave, mientras que 48 personas serían diagnosticadas erróneamente de este estadio de la enfermedad;
• con el valor de corte bajo o de "descarte", se descartaría la fibrosis grave correctamente en 430 personas, mientras que 58 personas con fibrosis no serían diagnosticadas;
• al utilizar conjuntamente ambos valores de corte, aproximadamente un tercio de las personas necesitarán pruebas adicionales ("zona gris").

Al combinar los resultados de los estudios sobre el índice de Forns para diagnosticar la fibrosis significativa (estadio 2), se puede afirmar lo siguiente para un grupo hipotético de 1000 personas:

• con el valor de corte alto o de "confirmación", 179 personas serían diagnosticadas correctamente de fibrosis significativa, mientras que 13 personas serían diagnosticadas erróneamente de este estadio de la enfermedad;
• con el valor de corte bajo o de "descarte", se descartaría correctamente la fibrosis significativa en 218 personas, mientras que se pasaría por alto a 83 personas;
• al utilizar conjuntamente ambos valores de corte, aproximadamente la mitad de las personas necesitarán pruebas adicionales ("zona gris").

¿Cuáles son las limitaciones de la evidencia?

La confianza en la evidencia se redujo porque muchos de los estudios podrían haber sobrestimado la exactitud diagnóstica de las pruebas. Además, las cifras descritas anteriormente son un resumen basado en la agrupación de los resultados de muchos estudios. Dado que las estimaciones de precisión variaron considerablemente en los distintos estudios, no es posible tener la certeza de que la aplicación de la puntuación FIB-4 o del índice de Forns produzca siempre estos resultados.

¿Cuál es el grado de actualización de esta evidencia?

La evidencia está actualizada hasta el 13 de abril de 2022.

Conclusiones de los autores: 

Tanto la puntuación FIB-4 como el índice de Forns se podrían tener en cuenta para la evaluación inicial de las personas con HCC. El valor de corte bajo de la puntuación FIB-4 (1,45) se puede utilizar para descartar a las personas con fibrosis al menos grave (≥ F3) y cirrosis (F4). El valor de corte alto del índice de Forns (6,9) se puede utilizar para diagnosticar a personas con una fibrosis al menos significativa (≥ F2). Se consideró que la mayoría de los estudios incluidos tenían un riesgo de sesgo incierto o alto. La calidad general del conjunto de evidencia fue baja o muy baja, y se necesitan más estudios de calidad alta. Esta revisión solo recogió datos de centros de referencia. Por lo tanto, al generalizar los resultados a una población de atención primaria, la probabilidad de falsos positivos será probablemente mayor y la de falsos negativos, menor. Es necesario seguir investigando en el África subsahariana, ya que estas pruebas podrían ser útiles en entornos con pocos recursos.

Leer el resumen completo…
Antecedentes: 

La presencia y la gravedad de la fibrosis hepática son variables pronósticas importantes a la hora de evaluar a las personas con hepatitis C crónica (HCC). Aunque la biopsia hepática sigue siendo la prueba de referencia, también se pueden utilizar marcadores serológicos no invasivos, como la puntuación de cuatro factores (FIB-4) y el índice de Forns, para estadificar la fibrosis hepática.

Objetivos: 

Determinar la exactitud diagnóstica de la puntuación FIB-4 y el índice de Forns en la estadificación de la fibrosis hepática en personas con hepatitis crónica por el virus de la hepatitis C (HCC), utilizando la biopsia hepática como prueba de referencia (objetivo primario). Comparar la exactitud diagnóstica de estas pruebas para estadificar la fibrosis hepática en personas con HCC y explorar posibles fuentes de heterogeneidad (objetivos secundarios).

Métodos de búsqueda: 

Se utilizaron los métodos de búsqueda Cochrane estándar para los estudios de exactitud diagnóstica (fecha de búsqueda: 13 de abril de 2022).

Criterios de selección: 

Se incluyeron estudios de diagnóstico transversal o de casos y controles que evaluaron la eficacia de la puntuación FIB-4, el índice de Forns, o ambos, en comparación con la biopsia hepática, en la evaluación de la fibrosis hepática en participantes con HCC. No se impusieron restricciones de idioma. Se excluyeron los estudios en los que los participantes tenían causas de enfermedad hepática además de la HCC, los participantes habían sido tratados con éxito para la HCC, o el intervalo entre la prueba índice y la biopsia hepática superaba los seis meses.

Obtención y análisis de los datos: 

Dos autores de la revisión extrajeron los datos de forma independiente. Se realizaron metanálisis utilizando el modelo bivariante y se calcularon estimaciones resumen. El rendimiento de ambas pruebas se evaluó en tres enfermedades de interés: fibrosis significativa o peor (estadio METAVIR ≥ F2); fibrosis grave o peor (estadio METAVIR ≥ F3); y cirrosis (estadio METAVIR F4). El metanálisis se restringió a los estudios que informaron valores de corte en un intervalo especificado (+/-0,15 para FIB-4; +/-0,3 para el índice de Forns) en torno a los valores de corte validados originales (1,45 y 3,25 para FIB-4; 4,2 y 6,9 para el índice de Forns). Se calculó el porcentaje de personas que recibirían un resultado indeterminado (es decir, por encima del umbral de descarte pero por debajo del umbral de confirmación) para cada combinación de prueba índice / valor de corte / enfermedad de interés.

Resultados principales: 

En la síntesis cualitativa se incluyeron 84 estudios (con un total de 107 583 participantes) de 28 países, publicados entre 2002 y 2021. De los 84 estudios, 82 (98%) fueron estudios transversales de exactitud diagnóstica con muestreo basado en cohortes, y los dos restantes (2%) fueron estudios de casos y controles. Todos los estudios se realizaron en centros de referencia. El metanálisis principal de esta revisión incluyó 62 estudios (100 605 participantes).

En general, dos estudios (2%) tenían bajo riesgo de sesgo, 23 estudios (27%) tenían riesgo incierto de sesgo y 59 estudios (73%) tenían alto riesgo de sesgo. Se consideró que 13 estudios (15%) tenían problemas de aplicabilidad en relación con la selección de los participantes.

Puntuación FIB-4

El valor de corte bajo de la puntuación FIB-4 (1,45) está diseñado para descartar a las personas con una fibrosis al menos grave (≥ F3). Treinta y nueve estudios de cohortes (86 907 participantes) arrojaron una sensibilidad resumida del 81,1% (intervalo de confianza [IC] del 95%: 75,6% a 85,6%), una especificidad del 62,3% (IC del 95%: 57,4% a 66,9%) y una razón de verosimilitud negativa (RV-) de 0,30 (IC del 95%: 0,24 a 0,38).

El valor de corte alto de la puntuación FIB-4 (3,25) está diseñado para confirmar a las personas con una fibrosis al menos grave (≥ F3). Veinticuatro estudios de cohortes (81 350 participantes) arrojaron una sensibilidad resumida del 41,4% (IC del 95%: 33,0% a 50,4%), una especificidad del 92,6% (IC del 95%: 89,5% a 94,9%) y una razón de verosimilitud positiva (RV+) del 5,6 (IC del 95%: 4,4 a 7,1).

Al utilizar la puntuación FIB-4 para evaluar la fibrosis grave y aplicar conjuntamente ambos valores de corte, el 30,9% de las personas obtendría un resultado indeterminado, que requeriría más investigaciones. En el texto principal de la revisión se presentan las estimaciones resumidas de la exactitud de la puntuación FIB-4 cuando se utiliza para evaluar la fibrosis significativa (≥ F2) y la cirrosis (F4).

Índice de Forns

El valor de corte bajo del índice de Forns (4,2) está diseñado para descartar a las personas con una fibrosis al menos significativa (≥ F2). Diecisiete estudios de cohortes (4354 participantes) arrojaron una sensibilidad resumida del 84,7% (IC del 95%: 77,9% a 89,7%), una especificidad del 47,9% (IC del 95%: 38,6% a 57,3%) y una RV- de 0,32 (IC del 95%: 0,25 a 0,41).

El valor de corte alto del índice de Forns (6,9) está diseñado para confirmar a las personas con una fibrosis al menos significativa (≥ F2). Doce estudios de cohortes (3245 participantes) arrojaron una sensibilidad resumida del 34,1% (IC del 95%: 26,4% a 42,8%), una especificidad del 97,3% (IC del 95%: 92,9% a 99,0%) y un RV+ del 12,5 (IC del 95%: 5,7 a 27,2).

Al utilizar el índice de Forns para evaluar la fibrosis significativa y aplicar conjuntamente ambos valores de corte, el 44,8% de las personas obtendría un resultado indeterminado, que requeriría más investigaciones. En el texto principal se informan las estimaciones de exactitud resumidas para el índice de Forns cuando se utiliza para evaluar la fibrosis grave (≥ F3) y la cirrosis (F4).

Comparación del FIB-4 con el índice de Forns

No hubo estudios suficientes para realizar un metanálisis del rendimiento del índice de Forns para el diagnóstico de fibrosis grave y cirrosis. Por lo tanto, no fue posible comparar el rendimiento de las dos pruebas para estas enfermedades de interés. Para el diagnóstico de fibrosis significativa y peor, no hubo diferencias significativas en su rendimiento cuando se utilizó el valor de corte alto. El índice de Forns funcionó ligeramente mejor que el FIB-4 cuando se utilizó el valor de corte bajo / descarte (sensibilidad relativa 1,12; IC del 95%: 1,00 a 1,25; p = 0,0573; especificidad relativa 0,69; IC del 95%: 0,57 a 0,84; p = 0,002).

Notas de traducción: 

La traducción de las revisiones Cochrane ha sido realizada bajo la responsabilidad del Centro Cochrane Iberoamericano, gracias a la suscripción efectuada por el Ministerio de Sanidad del Gobierno de España. Si detecta algún problema con la traducción, por favor, contacte con comunica@cochrane.es.

Tools
Information