Qual foi o objetivo desta revisão?
Existem muitos tipos de câncer no sangue, sendo eles chamados de leucemia. A leucemia linfocítica crônica (LLC) é o tipo mais comum. Vinte e cinco por cento das pessoas que têm leucemia têm LLC. É natural que as pessoas com LLC recentemente diagnosticada e as suas famílias queiram saber o que acontecerá com a sua saúde no futuro. Eles podem estar se perguntando se ou quando precisarão de tratamento, se ou quando a doença irá piorar ou por quanto tempo as pessoas vivem com LLC.
Os investigadores identificaram diversas características associadas a estes desfechos. A partir destas características, tentaram desenvolver ferramentas que ajudem a prever o que pode acontecer a grupos de pessoas com LLC recentemente diagnosticada.
O objetivo desta revisão Cochrane é avaliar e resumir as ferramentas e os estudos que as testam com outros dados de pacientes.
Quais são as principais mensagens desta revisão?
Os revisores descobriram que não existe uma maneira confiável de prever o que pode acontecer ao longo do tempo com pessoas que têm LLC (não tratada). Uma das razões é que as ferramentas de predição ainda não foram suficientemente testadas em diversas populações, o que impede uma avaliação precisa de sua eficácia.
Além disso, os pesquisadores continuam a desenvolver opções de tratamento de LLC mais eficazes e com melhores resultados, e as ferramentas de previsão não acompanharam os avanços no tratamento.
Quais são os principais resultados da revisão?
Identificamos 52 ferramentas que foram projetadas para prever o que pode acontecer com pessoas recém-diagnosticadas com LLC. Para encontrar as melhores ferramentas, tivemos que selecionar cuidadosamente os estudos. Para aplicar essas ferramentas na prática clínica:
- uma ferramenta tem de ser testada por diferentes investigadores para prever o que pode acontecer com indivíduos com LLC em diferentes localizações geográficas, utilizando diferentes grupos de pessoas (ou seja, idade, género, estágio clínico) com LLC. Em outras palavras, não incluiríamos uma ferramenta se ela fosse testada apenas nas pessoas que forneceram seus dados para criá-la;
- os resultados da ferramenta devem ser consistentes para comprovar que funciona;
- os testes da ferramenta devem fornecer informações suficientes para mostrar o quão bem a ferramenta funciona. Por exemplo, os testes devem incluir grandes grupos de pessoas e informações suficientes sobre o tipo de LLC que possuem.
Encontramos três ferramentas que atendiam a esses requisitos: o Chronic lymphocytic leukaemia International Prognostic Index (CLL-IPI), o Barcelona-Brno score e o MDACC 2007 index score.
O CLL-IPI fez o melhor trabalho na identificação de pessoas que sobreviveriam mais tempo com LLC e pessoas que sobreviveriam menos tempo. No entanto, classificamos a qualidade dos estudos com o CLL-IPI como baixa porque eles não forneceram todas as informações necessárias para saber o quão precisa era a ferramenta. O Barcelona-Brno score e o MDACC 2007 index score foram testadas, em geral, em um menor número de pacientes e mostraram menor discriminação entre pessoas com um bom prognóstico em comparação com um pior prognóstico, e mostraram uma qualidade igualmente baixa dos estudos.
Conclusão
São necessárias mais pesquisas com boa qualidade metodológica para desenvolver e testar ferramentas que ajudem a prever como a LLC se comportará em diferentes grupos de pessoas ao longo do tempo. As ferramentas também devem se adaptar para prever com precisão o desempenho de novos tratamentos.
Apesar do grande número de estudos publicados de modelos prognósticos para SG, SLP ou SLT para adultos recém-diagnosticados e não tratados com LLC, apenas uma minoria destes (N = 12) foi validada externamente para o seu respetivo desfecho primário. Três modelos passaram por validação externa suficiente para permitir a metanálise da capacidade do modelo de prever desfechos de sobrevida. A falta de relatos nos impediu de resumir a calibração conforme recomendado. Dos três modelos, o CLL-IPI apresenta a melhor discriminação, apesar da superestimação. No entanto, o desempenho dos modelos pode mudar para indivíduos com LLC que recebem melhores opções de tratamento, uma vez que os modelos incluídos nesta revisão foram testados principalmente em coortes retrospectivas que receberam um regime de tratamento tradicional. Em conclusão, esta revisão mostra uma clara necessidade de melhorar a condução e a notificação tanto do desenvolvimento de modelos prognósticos como de estudos de validação externa. Para que os modelos prognósticos sejam utilizados como ferramentas na prática clínica, o desenvolvimento dos modelos (e os seus subsequentes estudos de validação) deve adaptar-se para incluir as mais recentes opções terapêuticas para prever com precisão o desempenho. As adaptações devem ser oportunas.
A leucemia linfocítica crônica (LLC) é o câncer mais comum do sistema linfático nos países ocidentais. Vários fatores clínicos e biológicos para a LLC foram identificados. No entanto, ainda não está claro quais dos modelos prognósticos disponíveis, que combinam esses fatores, podem ser usados na prática clínica para predizer desfechos a longo prazo em pessoas recém-diagnosticadas com LLC.
Identificar, descrever e avaliar todos os modelos prognósticos desenvolvidos para predizer a sobrevida global (SG), sobrevida livre de progressão (SLP) ou sobrevida livre de tratamento (SLT) em adultos recém-diagnosticados (anteriormente não tratados) com LLC, e meta-analisar seus desempenhos preditivos.
Pesquisamos nas bases eletrônicas MEDLINE (de janeiro de 1950 a junho de 2019 via Ovid), Embase (de 1974 a junho de 2019) e registros de ensaios em andamento (até 5 de março de 2020) por estudos de desenvolvimento e validação de modelos prognósticos para adultos não tratados com LLC. Além disso, checamos as listas de referências e os índices de citação dos estudos incluídos.
Incluímos todos os modelos prognósticos desenvolvidos para LLC que predizem SG, SLP ou SLT, desde que combinassem fatores prognósticos conhecidos antes do início do tratamento, e quaisquer estudos que testaram o desempenho desses modelos em indivíduos diferentes daqueles incluídos no desenvolvimento do modelo (ou seja, ' estudos externos de validação de modelo'). Incluímos estudos de adultos com LLC de células B confirmada que não haviam recebido tratamento antes do início do estudo. Não restringimos a busca com base no desenho do estudo.
Desenvolvemos um formulário de extração de dados para coletar informações com base no Checklist for Critical Appraisal and Data Extraction for Systematic Reviews of Prediction Modeling Studies (CHARMS). Dois revisores independentes selecionaram referências, extraíram dados e avaliaram o risco de viés de acordo com o Prediction model Risk Of Bias ASsessment Tool (PROBAST). Para modelos que foram validados externamente pelo menos três vezes, pretendíamos realizar uma meta-análise quantitativa do seu desempenho preditivo, ou seja, da calibração do modelo (proporção de pessoas previstas para experimentar o desfecho que de fato o experimentam) e discriminação (capacidade de diferenciar pessoas com e sem o evento) usando um modelo de efeitos randômicos. Quando um modelo categorizou os indivíduos em categorias de risco, agrupamos as frequências dos desfecho por grupo de risco (baixo, intermediário, alto e muito alto). Não aplicamos o GRADE porque ainda não estão disponíveis orientações para revisões de modelos prognósticos.
Dos 52 estudos elegíveis, identificamos 12 modelos validados externamente: seis foram desenvolvidos para SG, um para SLP e cinco para SLT. Em geral, os relatórios dos estudos foram fracos, especialmente as medidas de desempenho preditivo para calibração e discriminação. Além disso, também faltavam muitas vezes informações básicas, como os critérios de elegibilidade e o período de recrutamento dos participantes. Classificamos quase todos os estudos com alto risco de viés ou incerto, de acordo com o PROBAST. No geral, a aplicabilidade dos modelos e dos seus estudos de validação foi baixa ou incerta; as razões mais comuns foram o tratamento inadequado de dados faltantes e graves deficiências de relato referente aos critérios de elegibilidade, período de recrutamento, tempo de observação e medidas de performance preditivas.
Relatamos os resultados de três modelos de predição de SG, que tinham dados disponíveis de mais de três estudos de validação externos:
Chronic lymphocytic leukaemia International Prognostic Index (CLL-IPI)
Este escore inclui cinco fatores prognósticos: idade, estágio clínico, status mutacional da IgHV, microglobulina B2 e status de TP53. Calibração : para os grupos de risco baixo, intermediário e alto, a sobrevida agrupada em cinco anos por grupo de risco dos estudos de validação correspondeu às frequências observadas no estudo de desenvolvimento do modelo. No grupo de risco muito elevado, a sobrevida prevista do CLL-IPI foi inferior à observada em estudos de validação externa. Discriminação: a estatística c agrupada de sete estudos de validação externa (3.307 participantes, 917 eventos) foi de 0,72 (intervalo de confiança (IC) de 95% 0,67 a 0,77). O intervalo de predição (IP) de 95% deste modelo para a estatística c, que descreve o intervalo esperado para a capacidade discriminativa do modelo em um novo estudo de validação externa, variou de 0,59 a 0,83.
Barcelona-Brno score
Com o objetivo de simplificar o CLL-IPI, este escore inclui três fatores prognósticos: Estado mutacional IgHV, del(17p) e del(11q). Calibração : para o grupo de risco baixo e intermediário, a sobrevida agrupada por grupo de risco correspondeu às frequências observadas no estudo de desenvolvimento do modelo, embora o escore pareça superestimar a sobrevida para o grupo de alto risco. Discriminação : a estatística C agrupada de quatro estudos de validação externa (1.755 participantes, 416 eventos) foi de 0,64 (IC 95% 0,60 a 0,67); 95% PI 0,59 a 0,68.
MDACC 2007 index score
Os autores apresentaram duas versões deste modelo incluindo seis fatores prognósticos para prever a SG: idade, beta-2 microglobulina, contagem absoluta de linfócitos, sexo, estágio clínico e número de grupos ganglionares. Apenas um estudo de validação estava disponível para a versão mais abrangente do modelo, uma fórmula com nomograma, enquanto sete estudos (5.127 participantes, 994 eventos) validaram a versão simplificada do modelo, o index score. Calibração : para os grupos de risco baixo e intermediário, a sobrevida agrupada por grupo de risco correspondeu às frequências observadas no estudo de desenvolvimento do modelo, embora o escore pareça superestimar a sobrevida para o grupo de alto risco. Discriminação : a estatística c agrupada dos sete estudos de validação externa para o index score foi de 0,65 (IC 95% 0,60 a 0,70); 95% PI 0,51 a 0,77.
Tradução do Cochrane Brazil (Aléxia Gabriela da Silva Vieira e Aline Rocha). Contato: tradutores.cochrane.br@gmail.com