In der jüngsten Forschungsentwicklung haben Forscher von Google bekannt gegeben, dass ihr System für künstliche Intelligenz, AMIE (Articulate Medical Intelligence Explorer), seine Fähigkeiten erheblich verbessert hat und von der anfänglichen Unterstützung bei der Diagnose auf die langfristige Behandlung und das Management von Krankheiten erweitert wurde. In einer randomisierten Studie waren die Managementfähigkeiten von AMIE vergleichbar oder besser als die von Klinikern in mehreren Beratungsrunden mit professionellen Patientenakteuren. Dies zeigte sich in der Fähigkeit von AMIE, Tests, Behandlungen und Verschreibungen genau zu planen und maßgebliche klinische Leitlinien angemessen anzuwenden.
Original: https://research.google/blog/from-diagnosis-to-treatment-advancing-amie-for-longitudinal-disease-management/
Die Bedeutung und die Herausforderungen der klinischen Argumentation
Wirksame klinische Argumentation ist ein Eckpfeiler der Gesundheitsversorgung und umfasst alle wichtigen Entscheidungen in der Patientenversorgung. Qualitativ hochwertiges Clinical Reasoning erfordert nicht nur eine genaue Diagnose, sondern auch tiefgreifende Überlegungen zum Krankheitsverlauf, zum Ansprechen auf die Behandlung, zur sicheren Anwendung von Medikamenten und zur rationalen Nutzung von Leitlinien oder Evidenz in der gemeinsamen Entscheidungsfindung mit dem Patienten. Auch nach der Diagnose erfordert die Entwicklung eines optimalen Behandlungsplans häufig eine kontinuierliche Überwachung des Krankheitsverlaufs und der Erfahrungen des Patienten, die Entwicklung eines individuellen Behandlungsplans und eine informierte und gemeinsame Entscheidungsfindung, die aktiv an die individuellen Bedürfnisse und Präferenzen des Patienten sowie die Gegebenheiten des Gesundheitssystems angepasst ist. Große Sprachmodelle (Large Language Models, LLM) haben zwar ihr Potenzial zur Unterstützung des diagnostischen Dialogs bewiesen, doch ihre Fähigkeit, Schlussfolgerungen für das langfristige Krankheitsmanagement zu ziehen, muss noch weiter erforscht werden.
AMIE: der Sprung von der Diagnose zum Management des Krankheitsverlaufs
In der Studie "Towards Conversational AI for Disease Management" zeigte das Google-Forschungsteam, wie AMIE, ein KI-Forschungssystem für medizinische Argumentation und Dialog, bereits hervorragende Leistungen bei der Krankheitsdiagnose erbringt und seine Leistung durch die Integration der Fähigkeiten von LLM-Intelligenzen, die speziell für die Argumentation und den Dialog im klinischen Management optimiert wurden, noch weiter verbessert. - Das Team demonstrierte die bereits überragenden Fähigkeiten von AMIE bei der Krankheitsdiagnose und steigerte die Leistung von AMIE weiter, indem es die Fähigkeiten von LLM-Intelligenzen integrierte, die speziell für Clinical Management Reasoning und Dialog optimiert wurden.
Diese erweiterte Version von AMIE basiert auf Zwillinge zusätzlich zu den Hauptstärken der Modellfamilie, wie z. B. fortgeschrittenes kontextuelles Denken über große Entfernungen und eine sehr niedrige Rate an Illusionen. Dadurch ist AMIE in der Lage, den langfristigen (d. h. zeitlich aufeinanderfolgenden) Krankheitsverlauf, das Ansprechen auf eine Behandlung sowie Informationen über die sichere Verwendung von Medikamenten und klinische Leitlinien zu berücksichtigen. Dies bedeutet eine Erweiterung der Fähigkeiten von AMIE von der reinen Diagnose hin zu einer umfassenderen Unterstützung von Patienten und Klinikern bei komplexen Folgeschritten. Jüngste Fortschritte haben gezeigt, dass AMIE in der Lage ist, langfristige Interaktionen zwischen Patient und Arzt zu ermöglichen, mit einem Argumentationsprozess, der auf maßgeblichem klinischem Wissen basiert, das ständig aktualisiert wird, und der Fähigkeit, strukturierte Managementpläne zu erstellen, die mit anerkannten Leitlinien übereinstimmen.
AMIE unterstützt nun das langfristige Krankheitsmanagement mit Argumenten, die auf klinischen Richtlinien basieren, und der Fähigkeit, sich den Bedürfnissen der Patienten über mehrere Besuche hinweg anzupassen.
Komplexität der Krankheitsbewältigung
Die Herausforderungen der klinischen Versorgung gehen weit über die Erstdiagnose hinaus. Das Krankheitsmanagement erfordert eine Kombination von Faktoren, einschließlich der Nebenwirkungen der Behandlung, der Compliance der Patienten, der Änderung des Lebensstils und der ständig aktualisierten medizinischen Forschung und klinischen Leitlinien. Die Fähigkeit, Schlussfolgerungen für das Management zu ziehen, war eine bisher wenig erforschte Herausforderung für KI-Systeme, und das Aufkommen von AMIE verspricht, dies zu ändern.
AMIE nutzt die weitreichenden kontextbezogenen Fähigkeiten von Gemini, um auf klinische Leitlinien zuzugreifen und diese zu analysieren, um sicherzustellen, dass seine Empfehlungen auf evidenzbasierter Medizin beruhen.
Dual Intelligence Body Architecture: Verbesserung des Denkens
Um die Herausforderungen des Krankheitsmanagements zu bewältigen, hat das Google-Forschungsteam eine duale LLM-gesteuerte Intelligenzarchitektur entwickelt, die der Art und Weise ähnelt, wie menschliche Kliniker Managementprobleme angehen.
Dialog-AgentDie Intelligenz steht dem Benutzer direkt gegenüber und ist in der Lage, auf der Grundlage ihres unmittelbaren Verständnisses für den Zustand des Patienten schnell zu reagieren. Die Intelligenz übernimmt alle Aspekte des Arzt-Patienten-Dialogs, einschließlich der Erfassung von Informationen über den Zustand des Patienten, der Beantwortung von Fragen und des Aufbaus von Vertrauen zwischen Arzt und Patient. Mithilfe der Verarbeitung natürlicher Sprache und empathischer Kommunikationstechniken sorgt die Dialogintelligenz für ein reibungsloses und ansprechendes Benutzererlebnis.
Mx Intelligence (Management Reasoning Agent)Mx Intelligence: Kontinuierliche und tiefgreifende Analyse vorhandener Informationen, einschließlich klinischer Richtlinien und patientenspezifischer Daten, zur Optimierung von Patientenmanagementlösungen. mx Intelligence nutzt die fortschrittlichen kontextuellen Fähigkeiten von Gemini mit großer Reichweite, um große Mengen an Informationen zu integrieren und zu analysieren - einschließlich Abschriften von Patientengesprächen über mehrere Besuche hinweg und Hunderte von Seiten klinischer Richtlinien - und alle diese Informationen zu berücksichtigen. -- und alles zu berücksichtigen. Als Ergebnis kann Mx Intelligence strukturierte Test-, Behandlungs- und Nachsorgepläne erstellen, die die neuesten medizinischen Erkenntnisse, die bei früheren Besuchen gesammelten Informationen und die individuellen Präferenzen des Patienten berücksichtigen.
AMIEs Architektur mit zwei Intelligenzen: Die Dialogintelligenz interagiert mit dem Patienten, während die Mx-Intelligenz einen strukturierten Managementplan auf der Grundlage klinischer Leitlinien entwickelt. Der Managementplan legt die empfohlene Abfolge von Tests und Behandlungen für den Patienten fest.
Managemententscheidungen auf der Grundlage klinischer Leitlinien
Um die Zuverlässigkeit und Sicherheit des Managed Reasoning von AMIE zu gewährleisten, werden seine Fähigkeiten in erster Linie durch die Erweiterung der Testzeitberechnung zur Durchführung von Deep Reasoning und strukturierten Einschränkungen erreicht, während gleichzeitig sichergestellt wird, dass alle Empfehlungen auf maßgeblichen klinischen Kenntnissen basieren.AMIE stützt sich wiederum auf die weitreichenden kontextuellen Verständnisfähigkeiten von Gemini, um seine Ergebnisse mit relevanten, aktuellen klinischen Praxisrichtlinien und Arzneimittelverzeichnissen abzugleichen.
Dazu gehört die Auswahl und Verarbeitung von Dokumenten aus einer umfassenden Bibliothek klinischer Leitlinien, die glaubwürdige Quellen wie die Leitlinien des National Institute for Health and Care Excellence (NICE) und die Best-Practice-Leitlinien des BMJ abdecken, die das Mx Intelligence Body dann zur Entscheidungsfindung heranzieht, um sicherzustellen, dass seine Empfehlungen evidenzbasiert sind und mit der anerkannten Best Practice im Gesundheitswesen übereinstimmen.
Komplexe strukturierte Einschränkungen helfen, das Modell durch die vorgegebene Argumentationsstrategie zu führen, während iterativ erstellte und zusammengeführte Pläne die Qualität des Plans verbessern. So kann AMIE personalisierte Managementpläne erstellen, die sowohl evidenzbasiert als auch auf die individuellen Bedürfnisse des Patienten zugeschnitten sind.
AMIE verwendet Deep Reasoning mit strukturierten Einschränkungen (A), um einen strukturierten Managementplan (B) zu erstellen, der auf einer Fallanalyse (C) und expliziten Managementzielen (D) basiert, die während des Besuchs durchzuführende Tests, geplante Tests und Behandlungsempfehlungen umfassen, die alle durch Referenzen (E) unterstützt werden. Ein Beispiel für einen Argumentationsprozess für einen fiktiven Patienten wird hier gezeigt.
Bewertung der Leistung von AMIE: Eine OSCE-Studie mit mehreren Runden
Um die Fähigkeit der AMIE zur langfristigen Krankheitsbewältigung kritisch zu bewerten, führte das Forschungsteam eine randomisierte, verblindete, virtuelle Objective Structured Clinical Examination (OSCE)-Studie durch, die eine Textchat-Konsultation simulierte. In dieser Studie wurde die AMIE mit 20 Hausärzten (PCPs) in 100 mehrrunden Konsultationsszenarien verglichen, um die Leistung der AMIE in einem realen klinischen Umfeld zu bewerten.
Überblick über die randomisierte Mehrrunden-OSCE-Studie.
Das mehrstufige Konsultationsdesign der OSCE-Studie ermöglichte es dem Studienteam, die Fähigkeit der AMIE zu beurteilen, 1) sich an Informationen aus früheren Interaktionen zu erinnern und diese zu integrieren, 2) den Behandlungsplan auf der Grundlage sich ändernder Patientensymptome und Testergebnisse anzupassen und 3) während des gesamten Behandlungsverlaufs konsistent und einfühlsam mit dem Patienten zu kommunizieren.
Die Fachleute bewerteten die Qualität des AMIE-Managementplans anhand einer Reihe von Kriterien, darunter Angemessenheit, Vollständigkeit, Verwendung klinischer Leitlinien und Patientenzentriertheit.
Fachärzte (die die Quelle des Plans nicht kannten) bewerteten den Managementplan von AMIE als nicht schlechter als den von PCPs und zeigten eine statistisch signifikante Verbesserung der Behandlungsgenauigkeit. Zu den Schlüsselindikatoren gehören hier die Auswahl geeigneter Tests und die Vermeidung unangemessener Tests (d. h. die Vermeidung unnötiger Tests auf der Grundlage bekannter Informationen). Statistisch signifikante (p < 0,05) Unterschiede in den p-Werten sind angegeben.
Darüber hinaus bewerteten Rollenspieler und Fachleute die AMIE, um festzustellen, ob ihr Verhalten den klinischen Bedürfnissen und Prioritäten entspricht. Das Forschungsteam ließ sich von früheren Arbeiten zur Identifizierung von Schlüsselmerkmalen des Managerial Reasoning inspirieren und entwickelte eine Pilotbewertungsskala, die auf diesen Merkmalen basiert und als Managerial Reasoning Experience Key Features (MXEKF) bezeichnet wird. .
Die AMIE schneidet bei den wichtigsten Kennzahlen für das Management (MXEKF) durchweg gut ab und hat positives Feedback von Patienten und Fachleuten erhalten.
RxQA: Benchmarking der pharmakotherapeutischen Urteilsfähigkeit
Die sichere und wirksame Anwendung von Medikamenten ist eine Schlüsselkomponente der Krankheitsbewältigung. Ein zuverlässiger Abruf von arzneimittelspezifischem Wissen mit angemessenem faktischem und themenspezifischem Denken ist eine notwendige, aber nicht hinreichende Bedingung. Um die Fähigkeiten von AMIE in diesen Bereichen zu messen, hat das Forschungsteam den RxQA entwickelt, einen neuartigen Satz von Multiple-Choice-Fragen, die von nationalen Arzneimittelbüchern abgeleitet sind, einschließlich der US Food and Drug Administration (FDA) und der British National Formulary (BNF).
Der RxQA enthält 600 Fragen, mit denen das Wissen über Indikationen, Kontraindikationen, Dosierungen, Nebenwirkungen und Wechselwirkungen von Arzneimitteln geprüft wird. Die Fragen wurden von approbierten Apothekern sorgfältig validiert, um Genauigkeit und Relevanz für die klinische Praxis zu gewährleisten.
Beispielfragen aus dem RxQA-Benchmark-Test zur Bewertung von Arzneimittelkenntnissen und logischem Denken. Alle in der Abbildung gezeigten Daten sind synthetisch (echte, aber keine echten Patientendaten).
AMIE hat beim RxQA-Benchmarking-Test hervorragende Ergebnisse erzielt und damit ein tiefgreifendes Verständnis der Arzneimittelinformationen und -richtlinien bewiesen. Die gepunktete Linie stellt die Genauigkeit dar, die durch zufälliges Raten erreicht werden kann.
Einschränkungen
Diese Ergebnisse zeigen zwar das Potenzial von AMIE in dem aufstrebenden und wichtigen Bereich der KI-Anwendungen in der Medizin, aber es sind auch einige Einschränkungen zu beachten. Das simulierte OSCE-Szenario ist zwar wertvoll für eine standardisierte Bewertung, vereinfacht aber absichtlich die Komplexität der realen klinischen Praxis, die eine Überprüfung der Krankenakte, Interaktion mit elektronischen Gesundheitsakten und eine größere Bandbreite an Patienten- und Pathologiesituationen umfasst. In dieser Bewertung wurden nur Leitlinien aus einem einzigen Gesundheitssystem ausgewählt und es wurde nicht versucht, sie an den lokalen Kontext anzupassen, was eine der potenziellen Stärken von AMIE ist. Die kurzen Intervalle zwischen den simulierten Besuchen und die textbasierte Schnittstelle (im Gegensatz zu den multimodalen Erfahrungen der realen Telemedizin) könnten die Schwierigkeiten in der realen Welt unterschätzen, und die MXEKF-Skala ist zwar als Pilotbewertungsskala vielversprechend, muss aber noch weiter validiert werden.
Schlussfolgerungen und Ausblick
Die starke Leistung von AMIE in diesen Evaluierungen stellt einen bedeutenden Schritt nach vorn dar, um das Potenzial von konversationeller KI als leistungsstarkes Werkzeug zur Unterstützung von Ärzten bei der Behandlung von Krankheiten zu demonstrieren. Durch die Kombination von langfristigen Schlussfolgerungen, klinischen Leitlinien und einem multi-intelligenten Systemdesign demonstriert AMIE die "Kunst des Möglichen" für KI-Systeme, um über die Differentialdiagnose hinaus zu einem langfristigen Management zu gelangen.
Weitere Forschungsarbeiten sind erforderlich, um die potenziellen Auswirkungen von AMIE auf klinische Arbeitsabläufe und Patientenergebnisse sowie die Sicherheit und Zuverlässigkeit des Systems unter realen Bedingungen besser zu verstehen, bevor es tatsächlich in der Praxis eingesetzt werden kann. Google hat mit klinischen Partnern zusammengearbeitet Es wurde eine prospektive Studie durchgeführt. Dennoch ist diese Arbeit ein wichtiger Meilenstein für die verantwortungsvolle Entwicklung von KI und das Potenzial, mit Hilfe von KI den Zugang zur evidenzbasierten Gesundheitsversorgung zu verbessern.