Nos últimos anos, tem havido grande avanço técnico e maior publicidade das técnicas e ferramentas de análise preditiva em saúde, notadamente daquelas que envolvem algoritmos de Machine Learning/Inteligência Artifiicial.
De forma resumida, a análise preditiva em saúde utilizando técnicas de machine learning é um ramo da área de Inteligência Artificial focado no desafio de predizer desfechos ou agrupar indivíduos, a partir de dados que chamamos de estruturados (o tipo mais comum de dado utilizado em saúde). Dados estruturados, por sua vez, são aqueles que possuem um formato previsível, padronizado, podendo ser inseridos, armazenados e processados num modelo tabular, como uma planilha de Excel, por exemplo. Nem todos os dados em saúde são estruturados — como as anotações clínicas em boa parte dos prontuários médicos, inseridas como textos de livre digitação. Porém, uma boa parte dos dados em saúde pode ser tabulada de maneira estruturada — exames clínicos, exames laboratoriais, dados demográficos, dados antropométricos e diversos outros parâmetros.
Na verdade, análise preditiva em saúde não é assunto novo. Há décadas os cientistas de dados, médicos e diversas outras categorias de pesquisadores têm se debruçado sobre o desafio de predizer desfechos futuros com os dados disponíveis hoje. Modelos preditivos mais tradicionais, como análises de regressão linear, têm sido a base para muitas conquistas em saúde, efetivamente tendo trazido ganhos reais em qualidade de vida, sobrevida e otimização de recursos. A novidade é a incorporação, ou melhor, a popularização de técnicas antes relegadas a outros campos do conhecimento, à área da saúde, sobretudo aquelas envolvendo novos algoritmos e técnicas de machine learning.
Em geral, temos visto um desempenho preditivo superior de muitos desses algoritmos, quando comparados a técnicas mais tradicionais. Não se trata, porém, apenas de “ranquear” acurácia preditiva. Ferramentas diferentes podem ter utilizadas diferentes, e sua aplicabilidade a uma situação específica deve ser analisada com bastante parcimônia. Longe de desmerecer as técnicas preditivas tradicionais, os algoritmos de machine learning tendem a agregar acurácia preditiva, focando na predição de desfechos ou na classificação/agrupamento de indivíduos — e não exatamente na descrição do peso ou da contribuição das variáveis preditoras. Via de regra, o grande trunfo dos algoritmos de machine learning — longe de constituirem uma “caixa preta” em que não se compreende sua mecânica — é conseguirem modelar padrões complexos de relações entre variáveis, que em última análise, levam a uma maior acurácia preditiva. Padrões complexos são mais bem detectados por computadores — eis por que o emprego de “machine learning” para as análises preditivas.
Este artigo não pretende, obviamente, esgotar o assunto, mas sim apresentar uma introdução ao tema. Aqui na Lean Saúde temos uma equipe de profissionais de ciência de dados/machine learning dedicada a realizar análises preditivas complexas, utilizando dados relevantes para a predição em saúde.