首页 > 营销学院 > IT资讯

通义千问开源Qwen2-Math，成为最先进的数学专项模型

8月9日消息，阿里通义团队开源新一代数学模型qwen2-math，包含1.5b、7b、72b三个参数的基础模型和指令微调模型。qwen2-math基于通义千问开源大语言模型qwen2研发，旗舰模型 qwen2-math-72b-instruct在权威测评集math上的得分超越gpt-4o、claude-3.5-sonnet、gemini-1.5-pro、llama-3.1-405b等，以84%的准确率处理了代数、几何、计数与概率、数论等多种数学问题，成为最先进的数学专项模型。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

通义千问开源qwen2-math，成为最先进的数学专项模型

注：在MATH基准测评中，通义千问数学模型的旗舰款Qwen2-Math-72B-Instruct取得了84%的准确率，超过GPT-4、Claude-3.5、Gemini-1.5-Pro和Llama-3.1等开闭源模型。

Qwen2-Math基础模型使用Qwen2大语言模型进行初始化，并在精心设计的数学专用语料库上进行预训练，训练数据包含大规模高质量的数学网络文本、书籍、代码、考试题目，以及由Qwen2模型合成的数学预训练数据。所有预训练和微调数据集都进行了去污染处理。

随后，研发团队训练了指令微调版本模型：首先，基于Qwen2-Math-72B训练一个数学专用的奖励模型；接着，将密集的奖励信号与指示模型是否正确回答问题的二元信号结合，用作学习标签，再通过拒绝采样构建监督微调（SFT）数据；最后在SFT模型基础上使用GRPO方法优化模型。

据悉，Qwen2-Math系列模型目前主要支持英文，通义团队很快就将推出中英双语版本，多语言版本也在开发中。

通义团队在多个中英文数学基准测评集对指令微调模型作了性能评估，除了GSM8K和MATH等常见的测评基准，还引入了更具挑战性的考试竞赛类测试，如奥林匹克级别的基准测评OlympiadBench、大学数学级别的基准测评CollegeMath、高考（GaoKao）、美国数学邀请赛（AIME）2025赛题、美国数学竞赛（AMC）2025赛题，中文测评则有CMATH测评集、2025年中国高考和中考数学题。最终，Qwen2-Math-72B-Instruct表现优异，在十大测评中都获得了远超其他开源数学模型的成绩。

Remover

几秒钟去除图中不需要的元素

304 查看详情 Remover

通义千问开源Qwen2-Math，成为最先进的数学专项模型

注：研发团队在greedy和RM@8 的条件下对模型作了测评，表中为每款Qwen2-Math-72B-Instruct模型列出了三个得分结果，分别是第1次回答得分（无下标数字）、8次回答中出现最多次数的答案的得分，8次回答中reward model所选答案的得分。

“大模型能不能做数学题”，不仅是社交平台的热门话题，也是业界非常关注的研究课题。处理高级数学问题，需要模型具备复杂多步逻辑推理能力。通义团队在技术博客中表示，希望通过开源“为科学界解决高级数学问题做出贡献”，未来将持续增强模型数学能力。

附：Qwen2-Math解题示例

通义千问开源Qwen2-Math，成为最先进的数学专项模型

以上就是通义千问开源Qwen2-Math，成为最先进的数学专项模型的详细内容，更多请关注其它相关文章！

# 音画 # 常州正规的网站推广报价 # 昆明网络建设网站 # 新乡长垣网站推广 # 淮安企业网站推广价格 # 实体营销推广合同模板 # 观澜短视频推广营销招聘 # 网站排名关键词热词 # 网站怎么简单优化 # 岳阳高端网站建设 # 晋城网站建设的作用 # 奥林匹克 # 数倍 # 产业 # 来袭 # 一键 # 美国 # 数学模型 # 作了 # 最先进 # 开源 # llama # qwen # claude # gemini # 通义千问

相关栏目：【 Google疑问12 】【 Facebook疑问10 】【优化推广96088 】【技术知识133117 】【 IDC资讯59369 】【网络运营7196 】【 IT资讯61894 】

2024-08-09

Notion AI怎么写笔记 Notion AI辅助写作及自动摘要生成技巧【教学】 AI一键生成高质量论文大纲 Claude帮你改写和润色文章 Claude写作风格优化技巧怎么用ai创作绘本 AI儿童故事与插画自动生成【秘籍】去哪旅行ai抢票助手怎么查看抢票历史_去哪旅行ai抢票助手历史记录查询与筛选【教程】如何用AI一键去除图片背景？AI自动抠图去底最强工具【实测】 DeepSeek数学建模应用指南 DeepSeek解决复杂问题技巧如何用AI一键扩图补全背景？Photoshop AI生成填充使用技巧【教程】 DeepSeek辅助撰写技术文档方法 DeepSeek开发者必备技巧文心一言官方网站在线入口文心一言在线版使用地址 Kimi国内访问入口_Kimi智能助手网页版链接直达如何用AI生成室内设计效果图？AI装修设计灵感生成指南【教程】 AI一键生成社交媒体自动回复蚂蚁阿福官网网页版入口_电脑端使用医保与健康服务如何用AI一键去视频水印 AI视频无痕去水印软件使用方法【教程】 Claude帮你解读晦涩的学术理论 Claude知识学习助手 Jasper AI怎么写社交媒体帖子 Jasper AI社媒内容创作【攻略】 DeepSeek长代码项目理解与分析 DeepSeek代码库学习方法 DeepSeek进行科学计算教程 DeepSeek物理建模与* AI一键生成短视频分镜头脚本

了解您产品搜索量及市场趋势，制定营销计划

同行竞争及网站分析保障您的广告效果

点击免费数据支持

提交您的需求，1小时内享受我们的专业解答。

运城市盐湖区信雨科技有限公司

运城市盐湖区信雨科技有限公司是一家深耕海外推广领域十年的专业服务商，作为谷歌推广与Facebook广告全球合作伙伴，聚焦外贸企业出海痛点，以数字化营销为核心，提供一站式海外营销解决方案。公司凭借十年行业沉淀与平台官方资源加持，打破传统外贸获客壁垒，助力企业高效开拓全球市场，成为中小企业出海的可靠合作伙伴。