No mais recente desenvolvimento de pesquisa, os pesquisadores do Google anunciaram que seu sistema de inteligência artificial, o AMIE (Articulate Medical Intelligence Explorer), aprimorou significativamente seus recursos, expandindo o auxílio inicial no diagnóstico para o tratamento e o gerenciamento de doenças a longo prazo. Em um estudo randomizado, o raciocínio gerencial do AMIE foi comparável ou melhor do que o dos médicos em várias rodadas de consultas com pacientes profissionais. Isso foi demonstrado pela capacidade da AMIE de planejar com precisão testes, tratamentos e prescrições, e de aplicar adequadamente diretrizes clínicas autorizadas.
Original: https://research.google/blog/from-diagnosis-to-treatment-advancing-amie-for-longitudinal-disease-management/
A importância e os desafios do raciocínio clínico
O raciocínio clínico eficaz é a pedra angular do setor de saúde e abrange todas as principais decisões no atendimento ao paciente. O raciocínio clínico de alta qualidade exige não apenas um diagnóstico preciso, mas também uma reflexão aprofundada sobre a progressão da doença, a resposta ao tratamento, o uso seguro de medicamentos e o uso racional de diretrizes ou evidências na tomada de decisões compartilhada com o paciente. Mesmo após o diagnóstico, o desenvolvimento de um plano de gerenciamento ideal geralmente exige o monitoramento contínuo do curso e da experiência do paciente, o desenvolvimento de um plano de tratamento individualizado e a tomada de decisão informada e compartilhada que seja ativamente adaptada às necessidades individuais do paciente, às suas preferências e às realidades do sistema de saúde. Embora os modelos de linguagem ampla (LLMs) tenham demonstrado potencial para apoiar o diálogo de diagnóstico, sua capacidade de raciocinar sobre o gerenciamento de doenças em longo prazo ainda precisa ser mais explorada.
AMIE: o salto do diagnóstico para o gerenciamento do curso da doença
No estudo, "Towards Conversational AI for Disease Management", a equipe de pesquisa do Google demonstrou como o AMIE, um sistema de pesquisa de IA para raciocínio e diálogo médico, já se destaca no diagnóstico de doenças e melhora ainda mais seu desempenho ao integrar os recursos de inteligências LLM otimizadas para raciocínio e diálogo de gerenciamento clínico. - A equipe demonstrou os recursos já superiores do AMIE no diagnóstico de doenças e aprimorou ainda mais o desempenho do AMIE ao integrar os recursos das inteligências LLM otimizadas especificamente para o raciocínio e o diálogo de gerenciamento clínico.
Essa versão aprimorada da AMIE foi desenvolvida com base em Gêmeos além dos principais pontos fortes da família de modelos, como o raciocínio contextual avançado de longo alcance e taxas muito baixas de ilusões. Isso permite que a AMIE aborde a progressão da doença a longo prazo (ou seja, sequencial ao longo do tempo), a resposta ao tratamento e informações sobre o uso seguro de medicamentos e diretrizes clínicas. Isso marca uma extensão dos recursos da AMIE, desde o diagnóstico puro até um suporte mais abrangente para pacientes e médicos em etapas complexas de acompanhamento. Avanços recentes demonstraram que o AMIE é capaz de interações de longo prazo entre o paciente e o médico, com um processo de raciocínio baseado em conhecimentos clínicos confiáveis que são continuamente atualizados e a capacidade de fornecer planos de gerenciamento estruturados que estão de acordo com as diretrizes reconhecidas.
A AMIE agora oferece suporte ao gerenciamento de doenças de longo prazo com raciocínio baseado em diretrizes clínicas e a capacidade de se adaptar às necessidades do paciente em várias visitas.
Complexidade do gerenciamento de doenças
Os desafios do atendimento clínico vão muito além do diagnóstico inicial. O gerenciamento de doenças requer uma combinação de fatores, incluindo efeitos colaterais do tratamento, adesão do paciente, modificações no estilo de vida e pesquisas médicas e diretrizes clínicas constantemente atualizadas. A capacidade de realizar raciocínio gerencial tem sido um desafio pouco explorado pelos sistemas de IA, e o surgimento da AMIE promete mudar isso.
A AMIE aproveita os recursos contextuais de longo alcance do Gemini para acessar e analisar as diretrizes clínicas e garantir que suas recomendações sejam baseadas em evidências médicas.
Arquitetura corporal de inteligência dupla: aprimorando o raciocínio
Para enfrentar os desafios do gerenciamento de doenças, a equipe de pesquisa do Google inovou uma arquitetura de inteligências duplas orientadas por LLM, que é semelhante à maneira como os clínicos humanos abordam os problemas de gerenciamento.
Agente de diálogoA inteligência é a única solução de inteligência que pode ser usada para atender às necessidades do paciente: diretamente voltada para o usuário, ela é capaz de responder rapidamente com base em sua compreensão imediata da condição do paciente. A inteligência lida com todos os aspectos do diálogo médico-paciente, incluindo a coleta de informações sobre a condição do paciente, a resposta a perguntas e a criação de confiança entre o médico e o paciente. Usando o processamento de linguagem natural e técnicas de comunicação empática, a Dialogue Intelligence garante uma experiência de usuário tranquila e envolvente.
Mx Intelligence (Agente de raciocínio gerencial)Mx Intelligence: análise contínua e aprofundada das informações existentes, incluindo diretrizes clínicas e dados específicos do paciente, para otimizar as soluções de gerenciamento de pacientes. O mx Intelligence aproveita os recursos contextuais avançados de longo alcance do Gemini para integrar e raciocinar sobre grandes quantidades de informações - incluindo transcrições de conversas com pacientes em várias visitas e centenas de páginas de diretrizes clínicas - e considerar todas elas. -- E levar tudo isso em conta. Como resultado, o Mx Intelligence pode criar planos estruturados de teste, tratamento e acompanhamento que levam em conta as evidências médicas mais recentes, as informações coletadas durante as visitas anteriores e as preferências individuais do paciente.
Arquitetura de inteligência dupla da AMIE: a Inteligência de Diálogo interage com o paciente, enquanto a Inteligência Mx desenvolve um plano de gerenciamento estruturado com base em diretrizes clínicas. O plano de gerenciamento especifica a sequência recomendada de testes e tratamentos para o paciente.
Decisões de gerenciamento baseadas em diretrizes clínicas
Para garantir a confiabilidade e a segurança do raciocínio gerenciado do AMIE, seus recursos são obtidos principalmente por meio da extensão da computação em tempo de teste para realizar um raciocínio profundo e restrições estruturadas, garantindo ao mesmo tempo que todas as recomendações sejam baseadas em conhecimentos clínicos confiáveis. O AMIE conta novamente com os recursos de compreensão contextual de longo alcance do Gemini para alinhar seus resultados com diretrizes de prática clínica e formulários de medicamentos relevantes e atualizados.
Isso inclui a seleção e o processamento de documentos de uma biblioteca abrangente de diretrizes clínicas que abrangem fontes confiáveis, como as diretrizes do National Institute for Health and Care Excellence (NICE) e as diretrizes de práticas recomendadas do BMJ, que o Mx Intelligence Body usa para auxiliar em seu processo de tomada de decisão, garantindo que suas recomendações sejam baseadas em evidências e estejam de acordo com as práticas recomendadas reconhecidas no campo da saúde.
Restrições estruturadas complexas ajudam a orientar o modelo por meio da estratégia de raciocínio especificada, enquanto os planos gerados de forma iterativa e mesclados ajudam a melhorar a qualidade do plano. Isso permite que a AMIE crie planos de gerenciamento personalizados que são baseados em evidências e adaptados às necessidades individuais do paciente.
A AMIE usa o raciocínio profundo com restrições estruturadas (A) para criar um plano de gerenciamento estruturado (B) que se baseia em uma análise de caso (C) e em objetivos explícitos de gerenciamento (D), que incluem testes a serem realizados durante a consulta, testes programados e recomendações de tratamento, todos apoiados por referências (E). Um exemplo de processo de raciocínio para um paciente fictício é mostrado aqui.
Avaliação do desempenho do AMIE: um estudo OSCE de várias rodadas
Para avaliar criticamente a capacidade do AMIE de lidar com o gerenciamento de doenças de longo prazo, a equipe de pesquisa conduziu um estudo randomizado, cego e virtual de Objective Structured Clinical Examination (OSCE) que simulou uma consulta por chat de texto. Nesse estudo, o AMIE foi comparado com 20 médicos de atenção primária (PCPs) em 100 cenários de casos de consulta em várias rodadas para avaliar o desempenho do AMIE em um ambiente clínico real.
Visão geral do estudo OSCE randomizado de múltiplas rodadas.
O projeto de consulta em várias rodadas do estudo OSCE permitiu que a equipe do estudo avaliasse a capacidade do AMIE de 1) lembrar e integrar informações de interações anteriores, 2) ajustar o plano de tratamento com base na mudança dos sintomas do paciente e nos resultados dos testes e 3) comunicar-se de forma consistente e empática com o paciente durante todo o curso do tratamento.
Os especialistas avaliaram a qualidade do plano de gerenciamento da AMIE com base em vários critérios, incluindo adequação, integridade, uso de diretrizes clínicas e centralização no paciente.
Os especialistas (que não sabiam a origem do plano) classificaram o plano de gerenciamento da AMIE como não inferior ao dos PCPs e mostraram uma melhora estatisticamente significativa na precisão do tratamento. Os principais indicadores aqui incluem a seleção de testes apropriados e a prevenção de testes inadequados (ou seja, evitar testes desnecessários com base em informações conhecidas). As diferenças estatisticamente significativas (p < 0,05) nos valores de p são mostradas.
Além disso, especialistas e atores de pacientes avaliaram a AMIE para determinar se seu comportamento refletia as necessidades e prioridades clínicas. A equipe de pesquisa se inspirou em trabalhos anteriores que identificaram as principais características do raciocínio gerencial e criou uma escala de avaliação piloto baseada nessas características, denominada Managerial Reasoning Experience Key Features (MXEKF). As principais medidas da MXEKF incluem priorização de preferências, restrições e valores, comunicação e tomada de decisão compartilhada, contraste e escolha entre diferentes cenários, monitoramento e adaptação de planos de gerenciamento e competência prognóstica. .
O AMIE tem um desempenho consistente nas principais métricas de raciocínio gerencial (MXEKF) e recebeu feedback favorável de pacientes-jogadores e especialistas.
RxQA: Avaliação comparativa do raciocínio farmacoterapêutico
O uso seguro e eficaz de medicamentos é um componente essencial do gerenciamento de doenças. A recordação confiável do conhecimento específico sobre medicamentos com raciocínio factual apropriado e específico do tópico é uma condição necessária, mas não suficiente. Para medir a capacidade da AMIE nessas áreas, a equipe de pesquisa criou o RxQA, um novo conjunto de perguntas de múltipla escolha derivadas de formulários nacionais de medicamentos, incluindo o US Food and Drug Administration (FDA) e o British National Formulary (BNF).
O RxQA contém 600 perguntas elaboradas para avaliar o conhecimento sobre indicações, contraindicações, dosagens, efeitos colaterais e interações de medicamentos. As perguntas foram cuidadosamente validadas por farmacêuticos certificados para garantir a precisão e a relevância para a prática clínica.
Exemplos de perguntas do Teste de Referência RxQA, desenvolvido para avaliar o conhecimento e o raciocínio sobre medicamentos. Todos os dados mostrados na figura são sintéticos (dados reais, mas não de pacientes reais).
A AMIE obteve excelentes resultados no teste de benchmarking RxQA, demonstrando uma compreensão profunda das informações e diretrizes sobre medicamentos. A linha pontilhada representa a precisão obtida por adivinhação aleatória.
limitações
Embora esses resultados demonstrem o potencial da AMIE na área emergente e importante dos aplicativos médicos de IA, há várias limitações a serem consideradas. O cenário OSCE simulado, embora valioso para a avaliação padronizada, simplifica intencionalmente a complexidade da prática clínica real, que inclui revisão de prontuários, interação com registros eletrônicos de saúde e uma variedade maior de situações de pacientes e patologias. Nesta avaliação, foram selecionadas apenas diretrizes de um único sistema de saúde e não foi feita nenhuma tentativa de adaptá-las ao contexto local, o que é um dos possíveis pontos fortes da AMIE. Os curtos intervalos entre as visitas simuladas e a interface baseada em texto (em oposição à experiência multimodal da telemedicina real) podem subestimar as dificuldades no mundo real. A escala MXEKF, embora promissora como escala de avaliação piloto, precisa de mais validação.
Conclusões e perspectivas
O bom desempenho demonstrado pela AMIE nessas avaliações representa um avanço significativo na demonstração do potencial da IA conversacional como uma ferramenta poderosa para auxiliar os médicos no gerenciamento de doenças. Combinando raciocínio de longo prazo, base em diretrizes clínicas e design de sistema corporal multiinteligente, a AMIE demonstra a "arte do possível" para que os sistemas de IA avancem além do diagnóstico diferencial em direção ao gerenciamento de longo prazo.
São necessárias mais pesquisas para entender melhor o impacto potencial da AMIE no fluxo de trabalho clínico e nos resultados dos pacientes, bem como a segurança e a confiabilidade do sistema dentro das restrições do mundo real, antes que ele possa ser aplicado no mundo real. O Google tem trabalhado com parceiros clínicos Foi realizado um estudo prospectivo. No entanto, esse trabalho é um marco importante no desenvolvimento responsável da IA e no potencial de uso da IA para melhorar o acesso à saúde baseada em evidências.