Una prueba diagnóstica es cualquier tipo de prueba médica realizada para ayudar al diagnóstico o la detección de una enfermedad. Una revisión sistemática de una prueba diagnóstica concreta para una enfermedad tiene como objetivo reunir y evaluar toda la evidencia disponible de estudios de investigación. En las bases de datos bibliográficas se suele buscar combinando los términos de la enfermedad con los de la prueba diagnóstica. Sin embargo, dependiendo del área temática, el número de artículos localizados por dichas búsquedas podría ser muy grande. Se han desarrollado filtros metodológicos que consisten en palabras y términos de indexación de bases de datos con la esperanza de mejorar las búsquedas aumentando su precisión al añadir estos filtros a los términos de búsqueda de la enfermedad y la prueba diagnóstica. Por otro lado, el uso de filtros para identificar las entradas de las revisiones diagnósticas podría hacer que se pierdan estudios relevantes y, al mismo tiempo, no suponga una gran diferencia en el número de estudios que hay que evaluar para su inclusión. Esta revisión evaluó el rendimiento de 70 filtros (recogidos en 19 estudios) para identificar estudios de diagnóstico en las dos principales bases de datos bibliográficas en salud, MEDLINE y EMBASE. Los resultados mostraron que los filtros de búsqueda no tienen un rendimiento uniforme, y no se deberían utilizar como único enfoque en las búsquedas formales para informar las revisiones sistemáticas sobre estudios de diagnóstico. Ninguno de los filtros alcanzó los criterios mínimos de esta revisión de una sensibilidad superior al 90% y una precisión superior al 10%.
Ninguno de los filtros metodológicos actuales diseñados para identificar informes de estudios primarios de DTA en MEDLINE o EMBASE combina una sensibilidad suficientemente alta, necesaria para las revisiones sistemáticas, con un grado razonable de precisión. Este hallazgo apoya la recomendación actual del Manual Cochrane para Revisiones Sistemáticas de Exactitud de Pruebas Diagnósticas de que la combinación de términos de búsqueda del filtro metodológico con términos de la prueba índice y la enfermedad de interés no se debe utilizar como único enfoque al realizar búsquedas formales para informar revisiones sistemáticas de DTA.
En cualquier revisión sistemática es fundamental realizar una búsqueda sistemática y exhaustiva del mayor número posible de estudios elegibles. Al buscar estudios de exactitud de pruebas diagnósticas (DTA por sus siglas en inglés) en bases de datos bibliográficas, se recomienda combinar los términos del trastorno (enfermedad de interés) con los términos de la prueba diagnóstica (prueba índice). Los investigadores han desarrollado filtros metodológicos para intentar aumentar la precisión de estas búsquedas. Estos consisten en palabras y términos de indexación de la base de datos y se añadirían a las búsquedas de la enfermedad de interés y de la prueba índice.
Identificar de forma eficiente las publicaciones de los estudios de DTA presenta desafíos porque a menudo la metodología no está bien comunicada en sus títulos y resúmenes, los términos de indexación adecuados podrían no estar disponibles y los términos de indexación pertinentes no parecen asignarse de manera uniforme. Una consecuencia del uso de filtros de búsqueda para identificar los registros para las revisiones diagnósticas es que podrían perderse estudios relevantes, mientras que el número de estudios irrelevantes que necesitarían evaluarse podría no reducirse. La guía actual para las revisiones Cochrane de DTA desaconseja añadir un filtro de búsqueda metodológica a la búsqueda de la enfermedad de interés y la prueba índice, como único método de búsqueda.
Revisar de forma sistemática los estudios empíricos que informan sobre el desarrollo o la evaluación, o ambos, de filtros metodológicos de búsqueda diseñados para recuperar estudios de DTA en MEDLINE y EMBASE.
Se hicieron búsquedas en MEDLINE (1950 hasta la semana 1 de noviembre de 2012); EMBASE (1980 hasta la semana 48 de 2012); el Registro del Grupo Cochrane de Metodología (Cochrane Methodology Group) (número 3, 2012); ISI Web of Science (11 de enero de 2013); PsycINFO (13 de marzo de 2013); Library and Information Science Abstracts (LISA) (31 de mayo de 2010); y Library, Information Science & Technology Abstracts (LISTA) (13 de marzo de 2013). Se realizaron búsquedas de citas en Web of Science, se comprobaron las listas de referencias de los estudios pertinentes y se realizaron búsquedas en el sitio web Search Filters Resource del InterTASC Information Specialists' Sub-Group (ISSG).
Fueron elegibles los estudios que informaron sobre el desarrollo o la evaluación, o ambos, de un filtro de búsqueda en MEDLINE o EMBASE destinado a identificar estudios de DTA, que informaron sobre una medida del rendimiento del filtro.
El desenlace principal era una medida del rendimiento del filtro, como la sensibilidad o la precisión. Se extrajeron datos sobre la identificación del conjunto de referencia (incluyendo el valor de referencia [gold standard] y, de utilizarse, los registros que no eran valores de referencia), cómo se utilizó el conjunto de referencia y cualquier limitación, la identificación y combinación de los términos de búsqueda en los filtros, las pruebas de validez interna y externa, el número de filtros evaluados, la fecha en que se realizó el estudio, la fecha en que se completaron las búsquedas y las bases de datos e interfaces de búsqueda utilizadas. Cuando se dispuso de datos 2 x 2 sobre el rendimiento del filtro, se utilizaron para calcular la sensibilidad, la especificidad, la precisión y el número necesario para leer (Number Needed to Read [NNR]), así como los intervalos de confianza (IC) del 95%. Se comparó el rendimiento de un filtro según el estudio de desarrollo original y cualquier estudio posterior que evaluara el mismo filtro.
Se incluyeron 19 estudios que informaron sobre 57 filtros de MEDLINE y 13 filtros de EMBASE. Treinta filtros de MEDLINE y cuatro de EMBASE se analizaron en un estudio de evaluación en el que se comprobó el rendimiento de uno o más filtros frente a uno o más valores de referencia. Las medidas de desenlace informadas variaron. Algunos estudios informaron de la especificidad, así como de la sensibilidad, si se utilizaba un conjunto de referencia que contuviera registros que no eran valores de referencia además de los registros valores de referencia. En algunos casos, el estudio de desarrollo original no informaba de los datos de rendimiento de los filtros. El rendimiento original del estudio de desarrollo no estaba disponible para 17 filtros que se analizaron posteriormente en estudios de evaluación. Los 19 estudios informaron la sensibilidad de los filtros que desarrollaron o evaluaron, nueve estudios informaron de las especificidades y 14 estudios informaron de la precisión.
Ningún filtro que tuviera datos de rendimiento originales de su estudio de desarrollo, y que fuera probado posteriormente en un estudio de evaluación, tenía lo que se definió a priori como sensibilidad (> 90%) y precisión (> 10%) aceptables. En los estudios que desarrollaron filtros de MEDLINE que se evaluaron en otro estudio (n = 13), la sensibilidad varió entre el 55% y el 100% (mediana del 86%) y la especificidad entre el 73% y el 98% (mediana del 95%). Las estimaciones del rendimiento fueron menores en ocho estudios que evaluaron los mismos 13 filtros de MEDLINE, con sensibilidades que iban del 14% al 100% (mediana del 73%) y especificidades que iban del 15% al 96% (mediana del 81%). La precisión varió entre el 1,1% y el 40% (mediana del 9,5%) en los estudios que desarrollaron los filtros de MEDLINE y entre el 0,2% y el 16,7% (mediana del 4%) en los estudios que evaluaron estos filtros. En los estudios de evaluación de los filtros de MEDLINE sin una medida de rendimiento original se informó un rango similar de especificidades y precisión. Las sensibilidades variaron entre el 31% y el 100% (mediana del 71%), la especificidad entre el 13% y el 90% (mediana del 55,5%) y la precisión entre el 1,0% y el 11,0% (mediana del 3,35%).
En el caso de los filtros de EMBASE, las sensibilidades originales informadas en dos estudios de desarrollo variaron entre el 74% y el 100% (mediana del 90%) para tres filtros, y la precisión varió entre el 1,2% y el 17,6% (mediana del 3,7%). Los estudios de evaluación de estos filtros tuvieron sensibilidades del 72% al 97% (mediana del 86%) y una precisión del 1,2% al 9% (mediana del 3,7%). El rendimiento de los filtros de búsqueda de EMBASE en los estudios de desarrollo y evaluación fue más parecido que el rendimiento de los filtros de MEDLINE en los estudios de desarrollo y evaluación. Ninguno de los filtros de EMBASE en ninguno de los dos tipos de estudios tuvo una sensibilidad superior al 90% ni una precisión superior al 10%.
La traducción de las revisiones Cochrane ha sido realizada bajo la responsabilidad del Centro Cochrane Iberoamericano, gracias a la suscripción efectuada por el Ministerio de Sanidad del Gobierno de España. Si detecta algún problema con la traducción, por favor, contacte con comunica@cochrane.es.