Baichuan-M3 - 百川智能开源的新一代医疗大语言模型

Últimos recursos sobre IAPublicado hace 3 meses Círculo de intercambio de inteligencia artificial

24.3K 00

Baichuan-M3是什么

Baichuan-M3是百川智能推出的新一代开源医疗大语言模型，专为医疗场景深度优化，具备强大的医疗推理和问诊能力。在权威的HealthBench评测中以65.1分的综合成绩位列全球第一，超越了GPT-5.2等顶尖模型，同时医疗幻觉率仅为3.5%，是目前全球最低水平，确保了输出信息的高度可靠性和安全性。Baichuan-M3首次实现了“端到端”严肃问诊能力，能像医生一样主动追问关键病史和风险信号，完整收集患者信息，问诊能力显著优于真人医生平均水平。融合了海量医学文献、临床指南、真实病历及药品知识库，提供全面且精准的医疗知识支持。

Baichuan-M3的功能特色

rendimiento líder：在全球权威医疗AI评测HealthBench及其高难度子集HealthBench-Hard中，Baichuan-M3以65.1分和44.4分的成绩双双夺冠，首次超越OpenAI的GPT-5.2，成为当前全球医疗沟通和推理能力最强的医疗大模型。
临床决策能力：模型不再局限于静态问答，而是显式建模临床决策过程，能主动获取关键临床信息、构建连贯的医疗推理路径，并系统性约束幻觉行为。在SCAN-Bench评测中，在临床问诊、实验室检查和诊断三个维度均排名第一，展现出与真实临床工作流程高度契合的能力。
幻觉抑制突破：Baichuan-M3通过事实感知强化学习框架，将幻觉抑制前移至训练阶段，仅依赖内部知识时幻觉率低至3.5%，显著低于GPT-5.2，成为全球医疗幻觉率最低的模型之一。
应用落地：基于Baichuan-M3的医疗AI助手“百小应”已上线，可模拟专业医生的诊断过程，通过主动追问帮助用户澄清症状，提供结构化、可审计的临床决策支持，助力医患沟通和医疗资源优化。

Baichuan-M3的核心优势

全球领先的评测成绩：在HealthBench和HealthBench Hard评测中均获得全球第一的成绩，超越了GPT-5.2等顶尖模型。
最低的医疗幻觉率：医疗幻觉率仅为3.5%，是目前全球最低水平，确保输出信息的高度可靠性和安全性。
强大的端到端问诊能力：首次具备原生的“端到端”严肃问诊能力，能像医生一样主动追问关键病史和风险信号，问诊能力显著优于真人医生平均水平。
深度医学知识整合：融合海量医学文献、临床指南、真实病历及药品知识库，提供全面且精准的医疗知识支持。
开源促进生态共建：通过开源策略，推动医疗AI生态的共建，加速技术在基层医疗、辅助诊断和健康管理等场景的落地。
多模态数据处理能力：支持文本、图像等多种模态数据的处理，能够更好地理解和分析复杂的医疗场景需求。

Baichuan-M3官网是什么

Repositorio GitHub：https://github.com/baichuan-inc/Baichuan-M3-235B
Biblioteca de modelos de caras abrazadas：https://huggingface.co/baichuan-inc/Baichuan-M3-235B