Hy-MT2 - 腾讯混元开源的多语言机器翻译模型家族

Últimos recursos sobre IAPublicado hace 2 meses Círculo de intercambio de inteligencia artificial

32.4K 00

Hy-MT2是什么

Hy-MT2 是腾讯混元开源的多语言机器翻译模型家族，专为复杂真实场景设计。包含 1.8B、7B 和 30B-A3B（MoE） 三个尺寸，均支持 33种语言 之间的互译，具备多语言翻译指令遵循能力。通过自研的 AngelSlim 极端量化技术，1.8B 模型可压缩至仅 440MB 存储空间，在苹果 A15 芯片上的推理速度较上一代提升 1.5倍，实现了高质量的端侧本地部署。

Hy-MT2的功能特色

33种语言互译：覆盖全球主流语种及少数民族语言，支持任意方向的高质量翻译。
翻译指令遵循：支持风格控制、格式保留（如分隔符、SRT字幕）、术语约束、法律脱敏、注释辅助等复杂翻译指令。
多精度量化部署：提供 FP16、8-bit、4-bit、2-bit 及 1.25-bit 等多种精度格式，适配从云端高并发到端侧低功耗的全场景需求。
专业领域翻译：针对金融、法律、政治、科技、医疗、教育六大领域进行专项优化，术语翻译精准。
真实场景鲁棒翻译：覆盖网页、会议、书籍、社交内容、新闻、文档等六大真实业务场景，对复杂输入分布具备强适应能力。
离线本地推理：1.8B 端侧模型可在无网络或弱网环境下运行，解决网络受限场景的翻译需求。

Hy-MT2的核心优势

性能超越开源大模型：7B 和 30B-A3B 模型在快思考模式下，性能超越 DeepSeek-V4-Pro、Kimi K2.6、Qwen3.5-397B-A17B 等开源基线，接近甚至部分超越 Géminis 3.1 Pro 和 GPT-5.5。
轻量模型 surpass 商业 API：1.8B 模型在 WMT25 等基准上整体超越微软翻译和豆包翻译等主流商业 API，实现小参数量的高效能。
极致端侧压缩：基于 AngelSlim 1.25-bit 稀疏三值量化，1.8B 模型仅需 440MB 存储，推理速度提升 1.5 倍，为目前端侧部署效率极高的翻译模型之一。
MoE 架构高效平衡：30B-A3B 采用混合专家架构，在保持顶级翻译质量的同时，相比同等性能稠密模型显著降低推理成本。
定向指令优化：在翻译专用指令遵循基准 IFMTBench 上，30B-A3B 在中小模型中取得最佳综合得分，复杂多约束指令处理能力突出。

Hy-MT2官网是什么

Página web del proyecto：https://aistudio.tencent.com/llm/en?tabIndex=0
Repositorio GitHub：https://github.com/Tencent-Hunyuan/Hy-MT2
Biblioteca de modelos HuggingFace：https://huggingface.co/collections/tencent/hy-mt2

Hy-MT2的操作步骤

普通用户快速体验：打开微信，搜索并进入「腾讯Hy翻译」小程序，无需下载安装即可直接输入文本或使用语音进行33种语言的实时互译，支持离线模式时提前下载端侧模型包。
开发者获取模型：访问 Hugging Face 或 ModelScope 平台，搜索 Tencent-Hunyuan/Hy-MT2，根据硬件条件选择下载 1.8B、7B 或 30B-A3B（MoE）模型权重。
选择精度格式：根据部署场景选取对应量化版本——云端高并发推荐 FP16 或 8-bit，本地 PC 推荐 4-bit，移动端或 IoT 设备推荐 2-bit 或 1.25-bit（1.8B 模型最低仅需 440MB 存储）。
加载模型与配置环境：使用 PyTorch 或 vLLM 等推理框架加载模型，配置目标语言对及翻译指令参数（如风格控制、术语约束、格式保留等），30B-A3B 需确保显存或内存满足 MoE 架构需求。
执行翻译任务：输入待翻译文本或文档，调用模型推理；可通过 Hy-MT2-Translator Skill 快速集成到现有工作流，支持批量处理、SRT 字幕翻译及法律脱敏等高级指令。
端侧离线部署（1.8B）：将 1.25-bit 量化后的 440MB 模型包集成到手机 App 或小程序中，利用 AngelSlim 引擎在苹果 A15 等芯片上本地运行，实现无网络环境下的低延迟翻译。
效果验证与调优：在 WMT25、IFMTBench 等基准或自有测试集上验证翻译质量，针对金融、法律等六大专业领域调整术语表和指令模板，必要时使用 FCPT 后训练流程进行领域定向优化。