Qwen3-Next - 阿里通义推出的最新基础模型

30.7K 00

Qwen3-Next是什么

Qwen3-Next是阿里通义开源的新一代混合架构大模型，结合了Gated DeltaNet和Gated Attention技术，擅长处理长文本，推理速度快且节省计算资源。模型分为指令版(Qwen3-Next-80B-A3B-Instruct )和思维版(Qwen3-Next-80B-A3B-Thinking)，分别擅长理解和执行指令及进行深度推理。模型总参数量达80B，每次推理仅激活约3B参数，显著降低计算成本。Qwen3-Next在多个领域有广泛应用，如智能客服、内容生成、数据分析等，能为用户提供高效、准确的服务。访问阿里云百炼和QwenChat网页版即可体验。

Qwen3-Next的功能特色

指令理解与执行：能精准理解用户指令并高效执行，适用多种自动化任务。
深度推理能力：支持复杂多步推理，适合解决需要深度思考的问题。
长文本处理：支持处理超长文本（32K以上），适合处理大量信息。
高效推理：基于混合动力引擎，推理速度快且资源消耗低。
节省资源：每次推理仅激活约3B参数，显著降低计算成本。
多领域应用：适用智能客服、内容生成、数据分析、教育辅助、法律咨询等多个领域。

Qwen3-Next的核心优势

混合架构：结合Gated DeltaNet和Gated Attention，实现速度和精度的平衡。
长文本处理：支持高效处理32K+长文本，适用于需要处理大量文本信息的场景。
高效率推理：推理速度是Qwen3-32B的10倍以上，适合需要快速响应的应用。
资源节省：总参数量80B，每次推理仅激活约3B参数，显著降低计算成本。
专家系统（MoE）：包含512个专家，动态选择最相关的专家进行工作，实现负载均衡。
预训练加速：通过原生MTP加速技术，减少推理步数，提高长文本生成速度。

Qwen3-Next的性能表现

Instruct 模型表现：Qwen3-Next的Instruct模型在多项基准测试中展现出卓越的指令理解能力，与235B旗舰模型相当。在长文本处理方面，它凭借独特的架构优势，能更高效地处理和分析大量文本，确保信息的完整性和准确性。
Thinking 模型表现：Qwen3-Next的Thinking模型在推理能力上表现突出，超越Gemini Flash。在一些关键指标上，甚至接近235B旗舰模型的水平，展现强大的多步推理和深度思考能力，能处理复杂的逻辑问题、提供精准的解决方案。