Hy3 preview - 腾讯混元发布并开源的语言模型
Hy3 preview是什么
Hy3 preview是腾讯混元发布并开源的语言模型,是团队重建预训练与强化学习基础设施后的首个成果。模型采用快慢思考融合的MoE架构,总参数达2950亿、激活参数210亿,最大支持256K上下文窗口。Hy3 preview在复杂推理、代码智能体、长文本理解等任务中表现突出,已在清华大学求真书院数学博资考中取得国内最高分,并首发接入Tencent Yuanbao (developers of the QQ instant messaging platform)、QQ、腾讯文档等全系主力产品。

Hy3 preview的功能特点
- 快慢思考融合架构:采用混合专家模型(MoE)设计,总参数2950亿、激活参数210亿,支持根据任务难度自动切换快思考与深度推理模式
- 256K超长上下文:最大支持25万字级别的上下文窗口,可处理超长文档、代码库及多轮复杂对话
- 顶尖复杂推理能力:在FrontierScience-Olympiad、IMO AnswerBench等高难度理工科基准测试中表现优异,清华大学求真书院数学博资考(2026春)国内最高分
- 代码与智能体能力:在SWE-Bench Verified、Terminal-Bench 2.0等代码智能体基准,以及BrowseComp、WideSearch等搜索智能体任务中具备强竞争力
- 长文本理解与指令遵循:基于腾讯业务场景自建CL-bench评测,复杂指令执行与长文档信息提取能力大幅增强
- Efficient inference performance:整体推理效率较上一代提升40%,首Token延迟降低54%,端到端响应时长降低47%
- 全生态产品接入:已作为主力模型接入腾讯元宝、QQ、腾讯文档、ima、CodeBuddy等全系产品,支持OpenClaw、OpenCode等开源智能体框架
Hy3 preview的核心优势
- 顶尖复杂推理能力:快慢思考融合架构下,在FrontierScience-Olympiad、IMO AnswerBench等高难度理工科基准,以及清华大学求真书院数学博资考中取得国内最高分,复杂问题拆解与深度分析能力行业领先。
- 高效务实的MoE架构:总参数2950亿、激活仅210亿,以中型模型成本实现大模型性能,整体推理效率较上一代提升40%,首Token延迟降低54%。
- 256K超长上下文窗口:最大支持25万字上下文,基于自建CL-bench评测,在长文档理解、信息提取与复杂指令遵循方面能力大幅增强。
- 代码与智能体竞争力:在SWE-Bench Verified、Terminal-Bench 2.0等代码智能体,以及BrowseComp、WideSearch等搜索智能体基准中均取得强竞争力结果。
- 极致性价比:API输入价格低至1.2元/百万tokens,腾讯云Token Plan个人版低至28元/月,让高质量AI能力真正普惠可用。
- 腾讯全系产品深度整合:已作为主力模型接入元宝、QQ、腾讯文档、ima、CodeBuddy等全系主力产品,办公与社交场景无缝融合。
- 开源生态友好:支持OpenClaw、OpenCode、KiloCode等主流开源智能体框架,开发者可快速接入构建AI应用。
- 真实业务导向的能力体系:跳出刷榜陷阱,基于腾讯真实业务场景自建评测体系,确保能力体系化不偏科,务实解决实际问题。
Hy3 preview官网是什么
- Project website:https://hunyuan.tencent.com/research/hy3
- GitHub repository:https://github.com/Tencent-Hunyuan/Hy3-preview
- HuggingFace Model Library:https://huggingface.co/tencent/Hy3-preview
使用Hy3 preview的操作步骤
- 通过腾讯元宝APP直接使用:下载并打开腾讯元宝APP,Hy3 preview已作为默认主模型上线,无需手动切换,直接输入问题即可体验快慢思考融合推理能力。
- 通过腾讯云API接入开发:访问腾讯云TokenHub平台,注册账号并获取API Key,根据文档配置API请求,支持0~16K、16~32K、32~256K三档上下文分桶按需调用。
- 接入开源智能体框架:在OpenClaw、OpenCode、KiloCode等开源框架中,将模型端点配置为Hy3 preview的API地址,填入密钥后即可在智能体工作流中调用其推理与代码能力。
- 在腾讯系产品中体验:在QQ、腾讯文档、ima、CodeBuddy、腾讯新闻、微信读书等已接入Hy3 preview的腾讯产品中,直接使用AI助手功能,无需额外配置。
- 购买Token Plan套餐:在腾讯云选择Token Plan个人版(最低28元/月)或企业版套餐,获取更优惠的token额度与稳定服务支持。
- 本地或私有化部署:关注混元开源社区动态,获取模型权重与部署文档,结合硬件资源进行本地化推理部署(需满足295B MoE模型的算力要求)。
Hy3 preview的适用人群
- 科研与学术工作者:需要处理高难度理工科问题、数学推导与前沿科学研究的学者,用在FrontierScience-Olympiad、IMO AnswerBench及清华数学博资考中的顶尖推理表现。
- Developers and Programmers:从事软件开发、代码调试与工程化实践的工程师,可借助SWE-Bench Verified、Terminal-Bench 2.0等代码智能体基准验证的强代码能力提升效率。
- AI智能体与Agent开发者:基于OpenClaw、OpenCode、KiloCode等开源框架构建AI应用或自动化工作流的开发者,可利用其BrowseComp、WideSearch等搜索智能体能力。
- 企业办公与协作人员:日常使用腾讯文档、ima、CodeBuddy、腾讯乐享等腾讯系办公产品的职场人士,可直接在熟悉的工作流中调用AI辅助。
- 长文档处理需求者:需要阅读、分析超长文档(如法律合同、研报、论文、代码库)的专业人士,256K上下文窗口可支持25万字级别的信息提取与理解。
- Students and educators:用国内顶尖的数学与逻辑推理能力辅助学习、解题、论文写作与教学备课,通过腾讯元宝APP即可免费体验。
Hy3 preview的常见问题
Q:Hy3 preview 的模型参数规模是多少?本地部署需要什么硬件配置?
A:Hy3 preview 采用混合专家(MoE)架构,总参数量为 2950 亿(295B),每次前向传播激活参数为 210 亿(21B)。由于总参数量较大,本地私有化部署需要较高的 GPU 显存与算力支持,建议关注混元开源社区发布的官方部署文档与硬件要求说明。
Q:Hy3 preview 支持多长的上下文窗口?
A:最大支持 256K Token 的上下文窗口,约合 25 万字。模型基于腾讯自建的长文本评测集 CL-bench 进行优化,在长文档理解、信息提取与复杂指令遵循方面能力大幅增强。
Q:什么是"快慢思考融合"?
A:这是 Hy3 preview 的核心架构特性,模型能够根据任务难度自动切换推理模式:面对简单问题快速响应,面对复杂数学、代码或逻辑推理问题时则启动深度慢思考,从而在效率与质量之间取得平衡。
Q:普通用户如何直接使用 Hy3 preview?
A:无需编程基础。Hy3 preview 已作为默认主模型上线腾讯元宝 APP,下载打开即可直接使用。同时,QQ、腾讯文档、ima、腾讯新闻、微信读书、QQ 浏览器等腾讯系产品也已接入该模型,可在日常应用中直接体验。
Q:开发者如何通过 API 接入 Hy3 preview?
A:开发者可访问腾讯云 TokenHub 平台,注册账号并获取 API Key,按照官方文档配置请求即可调用。模型支持接入 OpenClaw、OpenCode、KiloCode 等主流开源智能体框架。
Q:Hy3 preview 的 API 收费标准是什么?
A:TokenHub 采用按上下文长度分档定价:0~16K 输入 1.2 元/百万 tokens、输出 4 元/百万 tokens;16~32K 输入 1.6 元/百万 tokens、输出 6.4 元/百万 tokens;32~256K 输入 2 元/百万 tokens、输出 8 元/百万 tokens。缓存命中价格分别为 0.4、0.6、0.8 元/百万 tokens。
© Copyright notes
Article copyright AI Sharing Circle All, please do not reproduce without permission.
Related articles
No comments...




