阿里通义千问推出全新推理模型 Qwen3-30B-A3B-Thinking-2507，多项能力显著提升

时间：2025-07-31 09:42:01 来源：互联网

alixixi 7 月 31 日消息，阿里通义千问今日宣布推出全新推理模型 Qwen3-30B-A3B-Thinking-2507。相较于 4 月 29 日开源的 Qwen3-30-A3B 模型，新模型在推理能力、通用能力及上下文长度上有了显著提升：

新模型在聚焦数学能力的 AIME25 评测中斩获 85.0 的高分，在代码能力测试 LiveCodeBench v6 中得分 66.0，两项核心推理能力均超越 Gemini2.5-Flash（thinking）、Qwen3-235B-A22B（thinking）；新模型的知识水平（GPQA、MMLU-Pro）也较上一版本进步显著。

在写作（WritingBench）、Agent 能力（BFCL-v3）、多轮对话和多语言指令遵循（MultiIF）等通用能力评测中，Qwen3-30B-A3B-Thinking-2507 均超越 Gemini2.5-Flash（thinking）、Qwen3-235B-A22B（thinking）。

更长的上下文理解，原生支持 256K tokens，可扩展至 1M tokens。

此外，新模型的思考长度（thinking length）也增加了，官方推荐在高度复杂的推理任务中设置更长的思考预算，以充分发挥它的潜力。

官方透露，目前 Qwen3-30B-A3B-Thinking-2507 已在魔搭社区、HuggingFace 上开源，其轻量体积可轻松实现消费级硬件的本地部署；同时，其也在 Qwen Chat 上同步上线了新模型。

上一篇：Meta 公布 2025Q2 财报：营收 475.2 亿美元，同比增 22%；净利润 183.4 亿美元，增 36% 下一篇：微信鸿蒙版 App 获 1.0.9.32 版本邀测升级，支持长按桌面图标使用扫一扫和收付款

阿里通义千问推出全新推理模型 Qwen3-30B-A3B-Thinking-2507，多项能力显著提升

相关文章

阿里通义千问发布 Qwen3-Coder-Flash 模型，AI 智能体编程 / 操控浏览器等领域媲美 GPT-4.1 等领先闭源模型

阿里通义千问更新 Qwen3-30B 非思考模型：AI 性能媲美 GPT-4o，推理、代码、数学等能力全面跃升

基于通义千问 Qwen3 研发，蚂蚁数科发布金融推理大模型 Agentar-Fin-R1

阿里巴巴“夸克 AI 眼镜”深度融合支付宝生态、通义千问大模型，支持高德近眼导航等服务

阿里云通义千问宣布 Qwen-MT 机器翻译模型：支持 92 种语言互译，每百万输出 token 低至 2 元

阿里云通义千问 Qwen3-Coder 宣布开源：480B 参数、原生支持 256K 上下文，可与 Claude Sonnet4 媲美

最近更新