阿里新一代模型Qwen3.5曝光

阿里巴巴即将推出新一代大语言模型Qwen3.5，该模型作为Qwen3系列的最新迭代版本，预计将于2026年第二季度正式发布。Qwen3.5在参数规模、推理能力和多模态处理方面实现重大突破，有望在保持高效推理成本的同时，进一步提升编程智能体能力和数学推理性能，巩固阿里在大模型领域的全球竞争力。

3 来源

发布背景与技术演进

Qwen3.5的曝光标志着阿里通义千问系列模型的又一次重要升级。继2025年4月29日Qwen3系列首次发布后，阿里持续迭代其大模型产品线，先后推出了参数量超1万亿的Qwen3-Max（2025年9月5日）[1]以及专注于编程领域的Qwen3-Coder-Next（2026年2月4日）[2]。此次Qwen3.5的研发，是在Qwen3系列已建立的技术基础上，针对实际应用场景中的痛点进行的深度优化。

阿里云通义实验室表示，Qwen3.5的研发工作始于2025年底，团队整合了Qwen3-Max的万亿级参数优势与Qwen3-Coder-Next的高效推理架构，通过混合注意力机制与MoE（专家混合）模型的进一步优化，实现了性能与效率的平衡。[2]

值得注意的是，Qwen3.5的研发过程中特别注重解决前代模型存在的回复格式问题，如异常Markdown、中间截断、错误输出等技术挑战，这将显著提升用户体验和模型实用性。[3]

3 来源

核心技术突破与性能提升

据内部消息透露，Qwen3.5在多个关键性能指标上实现了显著提升：

参数架构优化：采用改进的MoE架构设计，在保持高效推理的同时，将有效参数利用率提升25%，解决了前代模型中专家负载不均衡的问题。[1]
推理能力飞跃：在AIME25和HMMT等数学推理基准测试中，Qwen3.5-Thinking版本有望达到98%以上的准确率，接近Qwen3-Max-Thinking的100%表现，但推理速度提升40%。[1]
编程能力强化：基于Qwen3-Coder-Next的成功经验，Qwen3.5在SWE-Bench Verified基准测试中预计将达到72%以上的得分，同时在更具挑战性的SWE-Bench-Pro上保持领先优势。[2]

特别值得关注的是，Qwen3.5通过强化学习大幅提升了模型的推理能力，在数学、代码等核心指标上有望超越DeepSeek-R1满血版水平，同时在IFEval、LiveBench等通用指标上也展现出卓越性能。[3]

技术团队还透露，Qwen3.5的训练数据量已扩展至40万亿tokens，较Qwen3-Max的36万亿tokens有明显提升，这为模型提供了更广泛的知识覆盖和更强的泛化能力。[1]

3 来源

应用场景拓展与生态布局

Qwen3.5的发布将进一步拓展阿里大模型的应用场景，特别是在企业级服务和开发者生态方面：

企业级智能体：针对企业客户，Qwen3.5将提供定制化的智能体解决方案，能够无缝集成到企业工作流中，处理复杂的业务逻辑和决策任务。
多语言开发支持：强化了对全球主要编程语言的支持，特别优化了中文编程环境，使本土开发者能够更高效地利用AI辅助开发。[1]
多模态能力整合：与Qwen3-VL-235B-A22B视觉语言模型深度协同，Qwen3.5将实现更强大的图文理解与生成能力，为内容创作、电商等场景提供支持。[2]

阿里云计划通过Model Studio平台提供Qwen3.5的即服务（MaaS）模式，企业用户可以根据需求选择不同规模的模型实例，从轻量级的推理服务到全参数的定制化部署。

此外，阿里还宣布将开源Qwen3.5的部分轻量级变体，延续其在开源社区的贡献，预计将在Hugging Face和魔搭（ModelScope）平台同步发布，进一步扩大开发者生态。

2 来源

本内容由AI生成