Fiabilité des échelles préhospitalières de l'AVC pour identifier les personnes victimes d'un AVC ou d'un accident ischémique transitoire (AIT)

Contexte

L'AVC est une maladie potentiellement mortelle par lésion du tissu cérébral. Cela peut être causé par un thrombus qui empêche l'apport de sang à une partie du cerveau ou par un saignement intra-cérébral. Si les symptômes disparaissent dans les 24 heures sans complications, il s’agit d'un AIT (mini-AVC). L'efficacité du traitement dépend du diagnostic précoce de l'AVC et tout retard peut entraîner des lésions cérébrales voire la mort.

Les services d'urgence sont le premier contact des personnes présentant des symptômes évoquant un AVC. Le personnel préhospitalier pourrait identifier les victimes d'un AVC avec plus de fiabilité s'ils utilisaient des «checklists» comme des échelles de reconnaissance des AVC. Ces échelles incluent les signes cliniques et d'autres informations facilement disponibles. Un résultat positif d’après l'échelle suggère un risque élevé d'AVC et la nécessité d'une évaluation urgente par un spécialiste. Les échelles ne permettent pas de faire la différence entre un AVC et un AIT ; cela sera fait à l'hôpital par un neurologue ou un médecin spécialiste de l’AVC.

Notre objectif était d'analyser les données disponibles sur la précision avec laquelle les échelles de reconnaissance de l'AVC peuvent détecter un AVC ou un AIT lorsqu'elles sont utilisées par des ambulanciers paramédicaux ou d'autres cliniciens préhospitaliers, qui sont le premier contact des personnes suspectées d'avoir un AVC.

Caractéristiques des études

Les preuves sont à jour au 30 janvier 2018. Nous avons inclus des études visant à évaluer la fiabilité des échelles de reconnaissance extra-hospitalière de l'AVC lorsqu'elles sont appliquées à des adultes suspects d’AVC.

Nous avons inclus 23 études évaluant les échelles suivantes : Cincinnati Prehospital Stroke Scale (CPSS ; 11 études), Recognition of Stroke in the Emergency Room (ROSIER ; huit études), Face Arm Speech Time (FAST ; cinq études), Los Angeles Prehospital Stroke Scale (LAPSS ; cinq études), Melbourne Ambulance Scale (MASS ; trois études), Ontario Prehospital Stroke Screening Tool (OPSST ; une étude), Medic Prehospital Evaluation for Code Stroke (MedPACS ; une étude) et PreHospital Ambulance Stroke Test (PreHAST; une étude). Neuf études ont comparé deux échelles ou plus chez les mêmes patients. Les résultats de cinq études ont été combinés pour estimer la fiabilité de l’échelle ROSIER dans les services d'urgence et de cinq autres études pour estimer celle de l’échelle LAPSS en pré-hospitalier.

Qualité des données

Plusieurs études étaient de faible qualité ou de qualité indéterminée et nous ne pouvions pas être certains que leurs résultats étaient valides.

Principaux résultats de la fiabilité des échelles préhospitalières de l'AVC

Les études étaient considérablement différentes en termes de patients inclus et d'autres caractéristiques. Par conséquent, les études évaluant la même échelle ont donné des résultats variables.

Nous avons combiné cinq études évaluant l’échelle ROSIER dans les services d'urgence et obtenu une sensibilité moyenne de 88 % (88 personnes sur 100 ayant eu un AVC ou un AIT auront un résultat positif avec l’échelle ROSIER). Nous n'avons pas été en mesure d'obtenir une estimation de la spécificité (nombre de personnes n'ayant pas eu d'AVC ou d'AIT et qui auront un résultat négatif).

Nous avons également combiné les résultats de l’échelle LAPSS, mais les études incluses étaient de faible qualité et les résultats pourraient ne pas être valides. Les autres échelles ont été évaluées avec un nombre d'études plus faible où les résultats étaient trop variables pour être combinés statistiquement.

Un petit nombre d'études ont comparé deux échelles ou plus lorsqu'elles étaient appliquées aux mêmes patients. De telles études sont plus susceptibles de donner des résultats valides puisque les échelles sont utilisées dans les mêmes circonstances. Ils ont signalé que dans les services d'urgence, les échelles ROSIER et FAST avaient une précision similaire, mais l’échelle ROSIER a été évaluée dans d'autres études. Lorsqu’elle a été utilisée par le personnel pré-hospitalier, l’échelle CPSS a permis d'identifier un plus grand nombre de personnes victimes d'AVC ou d'AIT dans toutes les études, mais aussi un plus grand nombre de personnes sans AVC ou AIT dont le résultat était positif.

Conclusion

Les données probantes actuelles suggèrent que l’échelle CPSS devrait être utilisée en pré-hospitalier. D'autres recherches sont nécessaires pour estimer la proportion de résultats erronés et pour déterminer si d'autres échelles, telles que les échelles MASS ou ROSIER, qui pourraient avoir une sensibilité comparable mais une spécificité plus élevée, devraient être utilisées pour obtenir une meilleure précision. Dans les services d’urgence, l’échelle ROSIER devrait être l’échelle de choix. Dans un groupe de 100 personnes, dont 62 ont eu un AVC ou un AIT, le test sera négatif en moyenne pour 7 personnes victimes d'un AVC ou d'un AIT (entre 3 et 16). En raison du petit nombre d'études évaluant les tests dans un milieu spécifique, de leur faible qualité, des différences substantielles dans les caractéristiques des études et de la variabilité des résultats, ces résultats doivent être interprétés avec prudence et faire l'objet de vérifications plus poussées dans des études mieux conçues.

Conclusions des auteurs: 

Sur le terrain, l’échelle SCSP a toujours eu la sensibilité la plus élevée et devrait donc être préférée aux autres. D'autres preuves sont nécessaires pour déterminer sa fiabilité et si d'autres échelles, telles que celles de MASS et ROSIER, qui pourraient avoir une sensibilité comparable mais une spécificité plus élevée, devraient être utilisées à sa place pour obtenir une meilleure précision. Aux urgences, l’échelle ROSIER devrait être l’échelle de choix, car elle a été évaluée dans un plus grand nombre d'études que l’échelle FAST et a montré une sensibilité constamment élevée. Dans une cohorte de 100 personnes, dont 62 ont eu un AVC ou un AIT, le test ratera en moyenne sept personnes victimes d'un AVC ou d'un AIT (entre 3 et 16). Nous n'avons pas été en mesure d'obtenir une estimation de sa spécificité moyenne. En raison du petit nombre d'études par test et par conditions d’utilisation, du risque élevé de biais, des différences importantes dans les caractéristiques des études et de la grande hétérogénéité entre ces études, ces résultats doivent être considérés comme des hypothèses provisoires qui doivent être vérifiées par des études mieux conçues.

Lire le résumé complet...
Contexte: 

La détection rapide et précise de l'AVC par les ambulanciers paramédicaux ou d'autres cliniciens au moment du premier contact est cruciale pour que le traitement approprié puisse être démarré rapidement. Plusieurs échelles de reconnaissance de l'AVC ont été élaborées pour aider le triage initial. Toutefois, leur fiabilité demeure incertaine et il n'y a pas d'accord sur les échelles qui donnent les meilleurs résultats.

Objectifs: 

Identifier et examiner systématiquement les données relatives à la fiabilité des échelles de diagnostic de l'AVC, en préhospitalier ou dans les services d'urgence pour dépister les personnes suspectes d'AVC.

Stratégie de recherche documentaire: 

Nous avons fait des recherches dans CENTRAL, MEDLINE (Ovide), Embase (Ovide) et le Science Citation Index jusqu’au 30 janvier 2018. Nous avons examiné les listes de références de toutes les études et autres publications pertinentes et avons communiqué avec des experts dans le domaine pour trouver d'autres études ou des données non publiées.

Critères de sélection: 

Nous avons inclus des études évaluant la fiabilité des échelles de reconnaissance de l'AVC utilisées en milieu préhospitalier ou aux urgences pour identifier un AVC et un AIT chez les personnes suspectes d'un AVC. Les échelles devaient être appliquées à des patients et les résultats comparés au diagnostic final d'AVC ou d'AIT. Nous avons exclu les études qui étudiaient les échelles aux dossiers des patients ; celles qui n'ont recruté que des patients positifs au test de dépistage et sans données complètes (2x2).

Recueil et analyse des données: 

Deux auteurs de l'étude ont procédé indépendamment à un examen préalable en deux étapes de toutes les publications identifiées, ont extrait les données et ont évalué la qualité méthodologique des études incluses à l'aide d'une version adaptée du score QUADAS-2. Un troisième auteur a arbitré les décisions. Nous avons recalculé la sensibilité et la spécificité avec les intervalles de confiance (IC) à 95 % et les avons présentés dans des graphiques en forêt et comme aire sous la courbe ROC. Lorsqu'un nombre suffisant d'études ont rapporté la fiabilité du test dans le même contexte (préhospitalier ou service des urgences) et que le niveau d'hétérogénéité était relativement faible, nous avons regroupé les résultats en utilisant le modèle à effets aléatoires bivariés. Nous avons placé les résultats sur une courbe ROC sommaire (SROC) avec un point d'estimation (sensibilité et spécificité moyenne), un IC à 95 % et des régions de prévision. En raison du petit nombre d'études, nous n'avons pas effectué de méta-régression pour étudier l'hétérogénéité entre les études et l'exactitude relative des échelles. Nous avons plutôt résumé les résultats sous forme de tableaux et de diagrammes et présenté nos constatations sous forme narrative.

Résultats principaux: 

Nous avons sélectionné 23 études à inclure (22 articles de revues et un résumé de conférence). Nous avons évalué les échelles suivantes : Cincinnati Prehospital Stroke Scale (CPSS ; 11 études), Recognition of Stroke in the Emergency Room (ROSIER ; huit études), Face Arm Speech Time (FAST ; cinq études), Los Angeles Prehospital Stroke Scale (LAPSS ; cinq études), Melbourne Ambulance Scale (MASS ; trois études), Ontario Prehospital Stroke Screening Tool (OPSST ; une étude), Medic Prehospital Evaluation for Code Stroke (MedPACS ; une étude) et PreHospital Ambulance Stroke Test (PreHAST; une étude). Neuf études ont comparé la précision de deux échelles ou plus. Nous avons examiné 12 études présentant un risque élevé de biais et une avec des doutes quant à son applicabilité au vu de la sélection des patients ; 14 études présentant un risque incertain de biais et une avec des doutes quant à son applicabilité au vu de la norme de référence ; le risque de biais dans le domaine du rythme et du délai de la conduite de l’étude était élevé dans une étude et incertain dans 16 autres.

Nous avons mis en commun les résultats de cinq études évaluant l’échelle ROSIER dans les services d’urgence et de cinq études évaluant l’échelle LAPSS en milieu préhospitalier. Les études incluses dans la méta-analyse sur l’échelle ROSIER étaient de qualité méthodologique relativement bonne et ont produit une sensibilité moyenne de 0,88 (IC à 95 % : 0,84 à 0,91) avec l'intervalle de prévision variant entre 0,75 et 0,95. Cela signifie qu'en moyenne, l’échelle ne détectera pas 12 % des personnes victimes d'un AVC ou d'un AIT et que, selon les circonstances, cela peut varier de 5 % à 25 %. Nous n'avons pu obtenir une estimation moyenne fiable de la spécificité en raison de l'extrême hétérogénéité des résultats au niveau des études. La sensibilité moyenne de l’échelle LAPSS était de 0,83 (IC 95 % : 0,75 à 0,89) et la spécificité moyenne de 0,93 (IC 95 % : 0,88 à 0,96). Cependant, nous ne sommes pas certains de la validité de ces résultats, car quatre des études étaient à risque élevé de biais et une autre à risque incertain de biais. Nous n'avons pas présenté d'estimations moyennes pour le reste des échelles, car le nombre d'études par test et par conditions d’utilisation était faible, le risque de biais était élevé ou incertain et/ou les résultats étaient très hétérogènes.

Des études comparant deux échelles ou plus chez les mêmes participants ont révélé que les échelles ROSIER et FAST avaient une précision similaire lorsqu'elles étaient utilisées dans les services d'urgence. Sur le terrain, l’échelle SCSPR était plus sensible que les échelles MedPACS et LAPSS, mais sa sensibilité était semblable à celle de l’échelle MASS ; l’échelle MASS était plus sensible que l’échelle LAPSS. Par contre, les échelles MASS, ROSIER et MedPACS étaient plus spécifiques que l’échelle CPSS, et la différence dans les spécificités des échelles MASS et LAPSS n'étaient pas statistiquement significative.

Notes de traduction: 

Post-édition effectuée par Vibol Chhor et Cochrane France. Une erreur de traduction ou dans le texte d'origine ? Merci d'adresser vos commentaires à : traduction@cochrane.fr

Tools
Information

Les traductions sur ce site ont été rendues possibles grâce à la contribution financière du Ministère français des affaires sociales et de la santé et des instituts publics de recherche canadiens.