Hy3 preview - 腾讯混元发布并开源的语言模型

Latest AI Resources5hrs agorelease AI Sharing Circle

Hy3 preview是什么

Hy3 preview是腾讯混元发布并开源的语言模型，是团队重建预训练与强化学习基础设施后的首个成果。模型采用快慢思考融合的MoE架构，总参数达2950亿、激活参数210亿，最大支持256K上下文窗口。Hy3 preview在复杂推理、代码智能体、长文本理解等任务中表现突出，已在清华大学求真书院数学博资考中取得国内最高分，并首发接入Tencent Yuanbao (developers of the QQ instant messaging platform)、QQ、腾讯文档等全系主力产品。

Hy3 preview的功能特点

快慢思考融合架构：采用混合专家模型（MoE）设计，总参数2950亿、激活参数210亿，支持根据任务难度自动切换快思考与深度推理模式
256K超长上下文：最大支持25万字级别的上下文窗口，可处理超长文档、代码库及多轮复杂对话
顶尖复杂推理能力：在FrontierScience-Olympiad、IMO AnswerBench等高难度理工科基准测试中表现优异，清华大学求真书院数学博资考（2026春）国内最高分
代码与智能体能力：在SWE-Bench Verified、Terminal-Bench 2.0等代码智能体基准，以及BrowseComp、WideSearch等搜索智能体任务中具备强竞争力
长文本理解与指令遵循：基于腾讯业务场景自建CL-bench评测，复杂指令执行与长文档信息提取能力大幅增强
Efficient inference performance：整体推理效率较上一代提升40%，首Token延迟降低54%，端到端响应时长降低47%
全生态产品接入：已作为主力模型接入腾讯元宝、QQ、腾讯文档、ima、CodeBuddy等全系产品，支持OpenClaw、OpenCode等开源智能体框架

Hy3 preview的核心优势

顶尖复杂推理能力：快慢思考融合架构下，在FrontierScience-Olympiad、IMO AnswerBench等高难度理工科基准，以及清华大学求真书院数学博资考中取得国内最高分，复杂问题拆解与深度分析能力行业领先。
高效务实的MoE架构：总参数2950亿、激活仅210亿，以中型模型成本实现大模型性能，整体推理效率较上一代提升40%，首Token延迟降低54%。
256K超长上下文窗口：最大支持25万字上下文，基于自建CL-bench评测，在长文档理解、信息提取与复杂指令遵循方面能力大幅增强。
代码与智能体竞争力：在SWE-Bench Verified、Terminal-Bench 2.0等代码智能体，以及BrowseComp、WideSearch等搜索智能体基准中均取得强竞争力结果。
极致性价比：API输入价格低至1.2元/百万tokens，腾讯云Token Plan个人版低至28元/月，让高质量AI能力真正普惠可用。
腾讯全系产品深度整合：已作为主力模型接入元宝、QQ、腾讯文档、ima、CodeBuddy等全系主力产品，办公与社交场景无缝融合。
开源生态友好：支持OpenClaw、OpenCode、KiloCode等主流开源智能体框架，开发者可快速接入构建AI应用。
真实业务导向的能力体系：跳出刷榜陷阱，基于腾讯真实业务场景自建评测体系，确保能力体系化不偏科，务实解决实际问题。

Hy3 preview官网是什么

Project website：https://hunyuan.tencent.com/research/hy3
GitHub repository：https://github.com/Tencent-Hunyuan/Hy3-preview
HuggingFace Model Library：https://huggingface.co/tencent/Hy3-preview

使用Hy3 preview的操作步骤

通过腾讯元宝APP直接使用：下载并打开腾讯元宝APP，Hy3 preview已作为默认主模型上线，无需手动切换，直接输入问题即可体验快慢思考融合推理能力。
通过腾讯云API接入开发：访问腾讯云TokenHub平台，注册账号并获取API Key，根据文档配置API请求，支持0~16K、16~32K、32~256K三档上下文分桶按需调用。
接入开源智能体框架：在OpenClaw、OpenCode、KiloCode等开源框架中，将模型端点配置为Hy3 preview的API地址，填入密钥后即可在智能体工作流中调用其推理与代码能力。
在腾讯系产品中体验：在QQ、腾讯文档、ima、CodeBuddy、腾讯新闻、微信读书等已接入Hy3 preview的腾讯产品中，直接使用AI助手功能，无需额外配置。
购买Token Plan套餐：在腾讯云选择Token Plan个人版（最低28元/月）或企业版套餐，获取更优惠的token额度与稳定服务支持。
本地或私有化部署：关注混元开源社区动态，获取模型权重与部署文档，结合硬件资源进行本地化推理部署（需满足295B MoE模型的算力要求）。

Hy3 preview的适用人群

科研与学术工作者：需要处理高难度理工科问题、数学推导与前沿科学研究的学者，用在FrontierScience-Olympiad、IMO AnswerBench及清华数学博资考中的顶尖推理表现。
Developers and Programmers：从事软件开发、代码调试与工程化实践的工程师，可借助SWE-Bench Verified、Terminal-Bench 2.0等代码智能体基准验证的强代码能力提升效率。
AI智能体与Agent开发者：基于OpenClaw、OpenCode、KiloCode等开源框架构建AI应用或自动化工作流的开发者，可利用其BrowseComp、WideSearch等搜索智能体能力。
企业办公与协作人员：日常使用腾讯文档、ima、CodeBuddy、腾讯乐享等腾讯系办公产品的职场人士，可直接在熟悉的工作流中调用AI辅助。
长文档处理需求者：需要阅读、分析超长文档（如法律合同、研报、论文、代码库）的专业人士，256K上下文窗口可支持25万字级别的信息提取与理解。
Students and educators：用国内顶尖的数学与逻辑推理能力辅助学习、解题、论文写作与教学备课，通过腾讯元宝APP即可免费体验。

Hy3 preview的常见问题

Q：Hy3 preview 的模型参数规模是多少？本地部署需要什么硬件配置？

A：Hy3 preview 采用混合专家（MoE）架构，总参数量为 2950 亿（295B），每次前向传播激活参数为 210 亿（21B）。由于总参数量较大，本地私有化部署需要较高的 GPU 显存与算力支持，建议关注混元开源社区发布的官方部署文档与硬件要求说明。

Q：Hy3 preview 支持多长的上下文窗口？

A：最大支持 256K Token 的上下文窗口，约合 25 万字。模型基于腾讯自建的长文本评测集 CL-bench 进行优化，在长文档理解、信息提取与复杂指令遵循方面能力大幅增强。

Q：什么是"快慢思考融合"？

A：这是 Hy3 preview 的核心架构特性，模型能够根据任务难度自动切换推理模式：面对简单问题快速响应，面对复杂数学、代码或逻辑推理问题时则启动深度慢思考，从而在效率与质量之间取得平衡。

Q：普通用户如何直接使用 Hy3 preview？

A：无需编程基础。Hy3 preview 已作为默认主模型上线腾讯元宝 APP，下载打开即可直接使用。同时，QQ、腾讯文档、ima、腾讯新闻、微信读书、QQ 浏览器等腾讯系产品也已接入该模型，可在日常应用中直接体验。

Q：开发者如何通过 API 接入 Hy3 preview？

A：开发者可访问腾讯云 TokenHub 平台，注册账号并获取 API Key，按照官方文档配置请求即可调用。模型支持接入 OpenClaw、OpenCode、KiloCode 等主流开源智能体框架。

Q：Hy3 preview 的 API 收费标准是什么？

A：TokenHub 采用按上下文长度分档定价：0~16K 输入 1.2 元/百万 tokens、输出 4 元/百万 tokens；16~32K 输入 1.6 元/百万 tokens、输出 6.4 元/百万 tokens；32~256K 输入 2 元/百万 tokens、输出 8 元/百万 tokens。缓存命中价格分别为 0.4、0.6、0.8 元/百万 tokens。