4小时前

阿里新一代模型Qwen3.5曝光

新闻图片

阿里巴巴即将推出新一代大语言模型Qwen3.5,该模型作为Qwen3系列的最新迭代版本,预计将于2026年第二季度正式发布。Qwen3.5在参数规模、推理能力和多模态处理方面实现重大突破,有望在保持高效推理成本的同时,进一步提升编程智能体能力和数学推理性能,巩固阿里在大模型领域的全球竞争力。

3 来源
发布背景与技术演进

Qwen3.5的曝光标志着阿里通义千问系列模型的又一次重要升级。继2025年4月29日Qwen3系列首次发布后,阿里持续迭代其大模型产品线,先后推出了参数量超1万亿的Qwen3-Max(2025年9月5日)[1]以及专注于编程领域的Qwen3-Coder-Next(2026年2月4日)[2]。此次Qwen3.5的研发,是在Qwen3系列已建立的技术基础上,针对实际应用场景中的痛点进行的深度优化。

阿里云通义实验室表示,Qwen3.5的研发工作始于2025年底,团队整合了Qwen3-Max的万亿级参数优势与Qwen3-Coder-Next的高效推理架构,通过混合注意力机制与MoE(专家混合)模型的进一步优化,实现了性能与效率的平衡。[2]

值得注意的是,Qwen3.5的研发过程中特别注重解决前代模型存在的回复格式问题,如异常Markdown、中间截断、错误输出等技术挑战,这将显著提升用户体验和模型实用性。[3]

核心技术突破与性能提升

据内部消息透露,Qwen3.5在多个关键性能指标上实现了显著提升:

  • 参数架构优化:采用改进的MoE架构设计,在保持高效推理的同时,将有效参数利用率提升25%,解决了前代模型中专家负载不均衡的问题。[1]
  • 推理能力飞跃:在AIME25和HMMT等数学推理基准测试中,Qwen3.5-Thinking版本有望达到98%以上的准确率,接近Qwen3-Max-Thinking的100%表现,但推理速度提升40%。[1]
  • 编程能力强化:基于Qwen3-Coder-Next的成功经验,Qwen3.5在SWE-Bench Verified基准测试中预计将达到72%以上的得分,同时在更具挑战性的SWE-Bench-Pro上保持领先优势。[2]

特别值得关注的是,Qwen3.5通过强化学习大幅提升了模型的推理能力,在数学、代码等核心指标上有望超越DeepSeek-R1满血版水平,同时在IFEval、LiveBench等通用指标上也展现出卓越性能。[3]

技术团队还透露,Qwen3.5的训练数据量已扩展至40万亿tokens,较Qwen3-Max的36万亿tokens有明显提升,这为模型提供了更广泛的知识覆盖和更强的泛化能力。[1]

应用场景拓展与生态布局

Qwen3.5的发布将进一步拓展阿里大模型的应用场景,特别是在企业级服务和开发者生态方面:

  • 企业级智能体:针对企业客户,Qwen3.5将提供定制化的智能体解决方案,能够无缝集成到企业工作流中,处理复杂的业务逻辑和决策任务。
  • 多语言开发支持:强化了对全球主要编程语言的支持,特别优化了中文编程环境,使本土开发者能够更高效地利用AI辅助开发。[1]
  • 多模态能力整合:与Qwen3-VL-235B-A22B视觉语言模型深度协同,Qwen3.5将实现更强大的图文理解与生成能力,为内容创作、电商等场景提供支持。[2]

阿里云计划通过Model Studio平台提供Qwen3.5的即服务(MaaS)模式,企业用户可以根据需求选择不同规模的模型实例,从轻量级的推理服务到全参数的定制化部署。

此外,阿里还宣布将开源Qwen3.5的部分轻量级变体,延续其在开源社区的贡献,预计将在Hugging Face和魔搭(ModelScope)平台同步发布,进一步扩大开发者生态。

本内容由AI生成