Intern-S1-Pro - 上海AI Lab开源的首个万亿参数科学多模态大模型

21.3K 00

Intern-S1-Pro是什么

Intern-S1-Pro是上海人工智能实验室开源的全球首个万亿参数级科学多模态大模型。采用512专家MoE架构，激活仅8专家22B参数，兼顾性能与效率。模型基于SAGE架构，引入傅里叶位置编码，统一理解微观生命到宏观宇宙信号，具备奥林匹克金牌级数理推理能力。预训练语料含5T tokens，科学数据占比超50%，在化学、材料、地学等科研任务全面领先。代码与权重已全开源，支持商用，为AGI4S提供国产自主基座。

Intern-S1-Pro - 上海AI Lab开源的首个万亿参数科学多模态大模型

Intern-S1-Pro的功能特色

기술 아키텍처：基于混合专家架构（MoE），拥有512个专家，总参数达1万亿，但每次调用仅激活8个专家（约220亿参数），兼顾性能与计算效率。通过引入傅里叶位置编码（Fope）和重构时序编码器，赋予模型对微观生命信号到宏观宇宙波动的“物理直觉”，支持多尺度科学信号分析。
科学能力：在化学、材料、生命科学、地球科学等领域的100多个专业子任务中表现卓越，综合学科评测（如SciReasoner、SFE等）达到国际领先水平，复杂数理逻辑推理能力媲美奥赛金牌水平，能处理化学逆合成、蛋白质序列生成、遥感图像分析等真实科研任务。
通用能力：兼具强大的图文跨模态理解、自然语言生成和复杂指令遵循能力，在MMLU-Pro、MMMU-Pro等通用基准测试中表现优异，开源模型中综合实力位居前列。
智能体能力：支持动态环境交互，在Tau²-Bench等智能体评测中达到国际一流水平，可作为科研助手自动调用外部工具，实现从任务规划到问题解决的全流程辅助。
算力与生态：与昇腾AI基础软硬件深度适配，构建“算力-算法”一体化基座，支持高效训练与推理。开源社区提供全链路工具体系（如XTuner训练框架、LMDeploy推理引擎），降低科研门槛，支持免费商用。

Intern-S1-Pro的核心优势

规模登顶：全球首个开源“万亿参数”科学大模型，512-MoE 仅激活 22 B，推理成本与百亿稠密模型持平。
科学专精：预训练 5 T tokens，>50 % 为化学、物理、生物、地学等高质量科学语料，AI4S 综合评测开源第一。
推理跃迁：自研 SAGE 架构 + 傅里叶位置编码，打通微观生命信号到宏观宇宙波动，数理奥赛金牌级水平。
训练稳定：首创 STE 路由 + 分组 All-to-All 通信，万亿 MoE 首次实现国产千卡集群 100 % 线性扩展零故障收敛。
全栈开源：模型、代码、数据配方、训练框架一键复现，Apache 2.0 协议可商用，同步上线 HuggingFace / ModelScope / GitHub。
即开即用：提供在线体验、标准 API 与科研插件，支持化合物逆向合成、气象预报、基因注释等场景零样本调用。