智谱AI推出数学模型MathGLM,阿里云魔搭社区全球首发
9月24日消息,智谱AI推出数学模型MathGLM,以提升大语言模型的数学推理能力。它可以在不使用计算器工具的情况下,高效执行复杂算术运算,解答中文数学应用题,部分表现超过GPT4和ChatGPT,目前已在魔搭社区ModelScope全球首发上架。
过往研究认为,大语言模型并不能精确执行高位数的算数运算,尤其是涉及超过8位数的乘法运算以及涉及小数、分数的运算。但MathGLM的出现,足以打破这些偏见。
MathGLM包含10M、100M、500M、2B等多个参数版本,具备处理最多12位数字的运算能力。而且有测评结果显示,通过充分的数据训练,MathGLM-2B可以准确执行多位数的算术运算,准确率高达93.03%(接近100%),显著超越GPT-4在相同测试数据上18.84%的准确率。10亿参数版本的MathGLM-10B则在5000条中文数学应用题的测试数据集上实现了接近GPT-4的性能。
MathGLM出色的表现,离不开其在模型架构、数据集等方面的一系列创新。
针对算术任务,研发团队采用Transformer的decoder架构,并使用自回归目标在生成的算术数据集上从头训练。算术训练数据集包含各类算术任务、各种运算符(含加法、减法、乘法、除法和求幂)、多种数字格式(含整数、小数、百分比、分数和负数)。研发团队还采用分步计算策略对该数据集进行了重构,并且让单个算术表达式由 2 到 10 个运算步骤组成,以方便MathGLM对每个中间结果进行准确计算,从而得到每个算术表达式的正确答案。
评测结果显示,MathGLM在一个包含9592条测试用例、专门为算术任务量身定制的数据集上的表现,显著优于GPT4和ChatGPT。
针对更复杂的数学问题——中文应用题,研发团队微调了一系列以GLM为基座模型、用于解决数学应用题的MathGLM。
训练过程中使用了一个包含21万道中文小学数学题的高质量数据集Ape210K,但其不足之处在于每个题的答案都是直接计算得出,缺乏相应的计算过程。因此,研发团队采用分步策略对Ape210K数据集进行了重构,方便MathGLM深入理解和学习潜在的计算逻辑和规则,逐步计算出每个数学问题的答案,提升最终答案的准确性。
此外,研发团队还使用 ChatGLM-6B 和 ChatGLM2-6B 作为基座模型来训练 MathGLM,赋予 MathGLM 基本的语言理解能力,使其能够有效理解数学应用题中包含的语言信息。
在Ape210K数据集上进行测试的结果显示,MathGLM模型在答案准确性方面已接近GPT-4。在一个包含1-6年级数学应用题的数据集K6上进行评测的结果显示,MathGLM相比于其他中文模型(GPT-4、ChatGPT、Chinese-Alpaca-13B、MOSS-16B、Ziya-LLaMA-13B、Baichuan-7B等),呈现出了更强的数学推理能力。
为方便开发者快速上手体验MathGLM,魔搭社区第一时间推出了模型体验、推理实践教程。
阿里云魔搭社区是国内规模最大、开发者最活跃的AI模型社区,拥有200多万开发者,聚集了20多家头部人工智能机构贡献的1000多款优质AI模型,为开发者提供一站式的模型体验、下载、推理、调优、定制等服务,社区模型累计下载量已突破7500万次。“找大模型,上魔搭”正在成为开发者的共识。
附:
MathGLM模型地址:
https://modelscope.cn/models/ZhipuAI/MathGLM/summary
魔搭创空间MathGLM模型体验链接:
https://www.modelscope.cn/studios/ZhipuAI/MathGLM-demo/summary
魔搭教程链接:
https://mp.weixin.qq.com/s?__biz=MzkxNTM5NTg2OA==&mid=2247486650&idx=1&sn=b1a729a720947a56a27d64dac1182519&chksm=c15e88c9f62901df978105f8ad084a72e651fbb97a7768b4159ecec751120c9772b795a41524#rd
相关文章
- 再登第一!天玑8300连续两个月成性能榜霸主,神U实力同档无敌!
- 存储产业链迎来复苏,中国存储企业江波龙联合元成苏州打通全线业务
- 三星Galaxy Z Flip5:以颠覆性的技术革新和用户体验赢得青睐
- 新年应该怎么玩?来中国移动,解锁专属新年大礼!
- 英语听说必备三大核心力,阿尔法蛋AI听说宝D1一站配齐!
- 学生党福利来袭 三星Galaxy手机寒假好价 乐购盛惠
- RTX 40 SUPER系显卡神搭好物盘点,华硕电源霸榜来袭!
- 新年新气象 三星Galaxy S24龙年赠礼更有“AI”
- 2024年FFALCON雷鸟新品发布会:ACE计划·新征程
- 2024春晚直播怎么看?当贝D5X看春晚直播超方便
- Wi-Fi Alliance总裁兼首席执行官Kevin Robinson:Wi-Fi 7有望迅速普及,超越前代技术
- 强势进化掌控未来,华硕天选X 2024预售开启!
- 随享春节假期,三星The Freestyle见证新年欢聚时刻
- 实至名归!追觅科技斩获2023年全球领航者大会“全球年度企业”
- 过年PS5玩个尽兴!细数适合团圆的“年味儿”游戏
- AutoAI2024第七届自动驾驶及智能座舱中国峰会开放注册
系统下载排行榜71011xp
萝卜家园Win7 sp1 64位旗舰版 V2021.05
2系统之家Win7 64位纯净版ISO镜像下载V2024
3【系统之家】Windows7 SP1 64位 全补丁旗舰版
4深度纯净版win7旗舰版镜像(支持USB3.0)
5【低配首选】深度技术 Ghost Win7 SP1 32位 旗舰精简版
6Win7系统 64位旗舰版(新机型+深度优化) V2024
7深度技术 Win7 64位精品旗舰版(带USB3.0/3.1驱动,新电脑) V2024
8系统之家Win7系统64位旗舰版(专业优化+新机型USB3.0支持)
9深度Ghost Win7纯净版(新机型新技术)镜像V2024
10系统之家 Ghost Win7 极限精简版 V2024
【娱乐专属】Windows11 22H2 64位 电竞游戏版
2不忘初心Win11 22H2 X64无更新纯净精简版 V2023
3系统之家Ghost Win11中文专业版 V2023
4Win11 64位专业版ISO官方原版镜像 V2022
5系统之家Win11纯净版精简镜像
6Win11 22H2(22621.819) 11月更新 V2022
7戴尔笔记本 Win11 64位 最新正式版 V2023
8系统之家 Ghost Win11 64位 精简纯净版 V2023
9Windows11 64位专业版ISO官方原版镜像 V2023
10Windows 11 22H2 22623.1020 Beta更新版 V2022
番茄花园Ghost XP Sp3纯净版 V2021.08
2系统之家Ghost WinXP SP3专业版 V2021.10
3深度技术Windows XP SP3 经典专业版 V2021.06
4电脑公司 Windows XP 经典版 V2021.04
5风林火山WindowsXP Sp3专业版 V2022.01
6番茄花园WindowsXP Sp3专业版 V2021.06
7萝卜家园 Windows Sp3 XP 经典版 V2021.04
8技术员联盟WindowsXP Sp3专业版 V2021.05
9萝卜家园WindowsXP Sp3专业版 V2021.05
10技术员联盟 Ghost WinXP SP3 精简版 V2021.12
热门教程 更多+
U盘装Win10显示:Windows无法打开所需的文件F:\sources\install.wim怎么办?
2Win11开机自动安装垃圾软件怎么办?Win11阻止流氓软件自动安装教程
3装Win10系统用磁盘分区类型选mbr好还是GUID分区格式好?
4Win10提示你的设备中缺少重要的安全和质量修复的解决方法
5Win11开机一直转圈怎么办 Win11开机一直转圈的解决办法
6Win10原版镜像怎么用PE安装 PE安装Win10原版镜像教程
7Win10系统的C盘如何扩大?Win10系统的C盘扩大的方法
8Win10专业版升级Win11正式版图文教程
9重装完Win10系统显示器不满屏怎么办?Win10桌面不难满屏解决方法
10Win10微软商店怎么安装不了软件?Win10微软商店无法安装软件解决方法
装机必备 更多+
重装教程 更多+
电脑教程专题 更多+