谷歌推出两大数学模型,19秒解开IMO2024几何问题

澎湃新闻
发布时间: 551次浏览

 4C1知多少教育网-记录每日最新科研教育资讯

·六道题每题可得7分,总分最高42分。谷歌DeepMind的人工智能系统在今年国际数学奥林匹克竞赛中最终得分28分。今年金牌的门槛是29分,在正式比赛的609名选手中,58名达到了这一门槛。4C1知多少教育网-记录每日最新科研教育资讯

·DeepMind表示,尽管基于自然语言的方法可以访问更多数据,但会产生看似合理但不正确的中间推理步骤和解决方案。而形式语言提供了一个重要优势,即涉及数学推理的证明可以被形式化地验证其正确性。4C1知多少教育网-记录每日最新科研教育资讯


4C1知多少教育网-记录每日最新科研教育资讯

DeepMind人工智能系统在IMO 2024上相对于人类竞争者的表现。在42分的总分中,人工智能系统获得了28分。4C1知多少教育网-记录每日最新科研教育资讯

谷歌DeepMind的AI模型解决了今年国际数学奥林匹克竞赛(IMO)六个问题中的四个问题,人工智能首次达到了银牌标准。4C1知多少教育网-记录每日最新科研教育资讯

当地时间7月25日,谷歌DeepMind公布专用于数学推理的模型AlphaProof,以及专注于几何的模型更新版本AlphaGeometry 2。DeepMind表示,AlphaProof和AlphaGeometry 2解决了数学中的高级推理问题,具有先进数学推理能力的通用人工智能或开启科学和技术的新领域。4C1知多少教育网-记录每日最新科研教育资讯

IMO是历史最悠久、规模最大、最负盛名的青年数学家竞赛,自1959年以来每年举办一次。选手要解决代数、组合学、几何和数论方面六个异常困难的问题。菲尔兹奖是数学家的最高荣誉之一,菲尔兹奖获得者也会代表他们的国家参加IMO。4C1知多少教育网-记录每日最新科研教育资讯

近年来,IMO竞赛被认为是机器学习领域的重大挑战,也是衡量人工智能系统高级数学推理能力的理想基准。4C1知多少教育网-记录每日最新科研教育资讯

谷歌DeepMind表示,IMO的数学问题被人工翻译成数学语言,供系统理解。在正式比赛中,学生们分两次提交答案,每次4.5小时。而人工智能系统在几分钟内解决了一个问题,花了三天时间来解决其他问题。基于强化学习的推理系统AlphaProof解决了两个代数问题和一个数论问题并被证明答案正确,这些问题包括今年IMO比赛中只有5名选手解决的最难的问题。AlphaGeometry 2证明了几何问题,但两个组合问题仍未解决。4C1知多少教育网-记录每日最新科研教育资讯

六道题每题可得7分,总分最高可达42分。DeepMind的人工智能系统最终得分28分。DeepMind表示,今年金牌的门槛从29分开始,在正式比赛的609名选手中,有58名达到了这个门槛。4C1知多少教育网-记录每日最新科研教育资讯

“事实上,这个程序能想出这样一个不明显的结构是非常令人印象深刻的,远远超出了我认为的最先进的水平。”IMO金牌得主和菲尔兹奖牌得主蒂莫西·高尔斯(Timothy  Gowers)表示。4C1知多少教育网-记录每日最新科研教育资讯

在大量书面文本上训练的人工智能模型历来在数学推理方面很困难,往往倾向于语言智能而非数学智能,解决数学问题需要更复杂的推理技能。AlphaProof将预先训练好的语言模型与AlphaZero强化学习算法结合在一起,AlphaZero此前自学了如何掌握国际象棋、将棋和围棋。4C1知多少教育网-记录每日最新科研教育资讯

大语言模型容易产生幻觉,或以令人信服的方式传递错误信息。DeepMind表示,尽管基于自然语言的方法可以访问更多数据,但会产生看似合理但不正确的中间推理步骤和解决方案。而形式语言提供了一个重要优势,即涉及数学推理的证明可以被形式化地验证其正确性。“我们通过微调Gemini模型,在这两个互补的领域之间建立了一座桥梁,自动将自然语言问题语句转换为形式语句,创建了一个不同难度的庞大形式问题库。”4C1知多少教育网-记录每日最新科研教育资讯

当遇到一个数学问题时,AlphaProof会生成候选解决方案,然后搜索可能的证明步骤来证明或反驳它们。每一个被发现和验证的证明都被用来强化AlphaProof的语言模型,增强其解决后续更具挑战性问题的能力。4C1知多少教育网-记录每日最新科研教育资讯


4C1知多少教育网-记录每日最新科研教育资讯

AlphaGeometry 2解决的几何问题:证明∠KIL与∠XPY之和等于180°。AlphaGeometry 2提出在直线BI上构造点E,使∠AEB=90°。点E有助于为AB的中点L提供作用,创造了许多对相似三角形,如三角形ABE和三角形YBI、三角形ALE和三角形IPC,以证明结论。4C1知多少教育网-记录每日最新科研教育资讯

AlphaGeometry 2是AlphaGeometry的一个改进版本。AlphaGeometry 2是一个神经符号混合系统,其中的语言模型基于Gemini模型,并在比前身多一个数量级的合成数据上从零开始训练。这帮助模型解决更具挑战性的几何问题,包括物体运动问题和角度、比例或距离方程。在今年的比赛之前,AlphaGeometry 2可以解决过去25年中IMO历史几何问题的83%,而AlphaGeometry只有53%。在今年的比赛中,AlphaGeometry 2收到形式语言后19秒内解决了问题。4C1知多少教育网-记录每日最新科研教育资讯

但谷歌研究人员也表示,人工智能远不能以其解决问题的能力取代人类数学家。“即使我们有最大的雄心壮志,我认为我们的目标是提供一个可以证明任何事情的系统。”谷歌DeepMind强化学习副总裁大卫·西尔弗(David Silver)表示,“但这并不是数学家工作的终点。”4C1知多少教育网-记录每日最新科研教育资讯

西尔弗说,DeepMind的人工智能模型更类似于强大的计算工具,有朝一日可能会帮助人类提出数学证明,但人工智能系统缺乏的是想象力,而“数学家提出了有趣的问题”。4C1知多少教育网-记录每日最新科研教育资讯

本文链接:http://knowith.com/news-3-647.html谷歌推出两大数学模型,19秒解开IMO2024几何问题

声明:本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

热门文章

延伸阅读

相关阅读

2023年春季高考专科分数线 2023春季高考专科录取分数线
2023年春季高考专科分数线 2023春季高考专科录取分数线相关内容,小编在这里做了整理,希望能对大家有所帮助,关于2023年春季高考专科分数线 2023春季高考专科录取分数线信息,一起来了解一下吧! 20
2023年临沂高考人数大概是多少
最近经常有小伙伴私信询问2023年临沂高考人数大概是多少相关的问题,今天,小编整理了以下内容,希望可以对大家有所帮助。 临沂2023共有8.1万人参加高考。 2023山东高考使用新高考1卷。总分
2023年高考专科分数线是多少?
2023年高考专科分数线是多少?很多朋友对这方面很关心,整理了相关文章,供大家参考,一起来看一下吧! 部分省份2023年春季高考专科分数线如下 : 1、重庆。文史类:专科线180分;理工类:专科线180分
山东石油大学春季高考分数 中国石油大学华东分数线
今天小编整理了山东石油大学春季高考分数 中国石油大学华东分数线相关信息,希望在这方面能够更好帮助到大家。 1、中国石油大学(华东)在北京录取分数线:文科录取批次本科批580分,理科录取批次本科批
广东地方专项计划分数线(广东2023春季高考补录分数线)
今天小编整理了广东地方专项计划分数线(广东2023春季高考补录分数线)相关内容,希望能帮助到大家,一起来看下吧。 广东2022年春季高考专科分数线介绍如下: 普通类(历史):总分180分。 普通类(
泰州二本大学有哪些
泰州二本大学有哪些很多朋友对这方面很关心,整理了相关文章,供大家参考,一起来看一下吧! 泰州二本大学有泰州学院、南京师范大学泰州学院、南京理工大学泰州科技学院等大学。 1、泰州学院

热点精选

最新推荐

您可能感兴趣