接近金牌水平,AI向人类奥数“下手”

从下棋到解析蛋白质结构,人工智能(AI)变得越来越无所不能。美国谷歌公司的DeepMind这次将目标瞄准数学领域,开发的一款AI几何推理模型——AlphaGeometry能够以接近国际数学奥林匹克(奥数)竞赛金牌得主的水平,解决复杂的几何问题。相关研究1月17日发表于《自然》。
奥数面向中学生每年7月举办,是全球最难的数学竞赛之一。解决奥数几何问题需要一定的数学创造力,而这正是AI一直在试图攻克的。即使在其他领域展现出非凡推理能力的OpenAI的GPT-4,在奥数几何问题上也只能得0分。
AI之所以对奥数几何问题久攻不下,除了问题的难度外,缺乏训练数据也是一个很重要的原因。奥数自1959年以来每年举办一次,且每次比赛只有6道题。然而,AI系统解决几何问题需要数百万甚至数十亿个数据点,现有数据远不能满足训练的需要。
为此,DeepMind的Thang Luong和同事创建了一种工具,可生成数以亿计的机器可读的几何证明,从而绕过了现有数据不足的难点。
研究人员使用这些数据对AlphaGeometry进行训练,并用30道奥数几何题对它进行基准测试。结果,AlphaGeometry在标准时限内正确解出了25道题。相比之下,之前最先进的系统解决了其中10道题,而根据预测,人类奥数金牌得主平均解决25.9道题。
Luong介绍,AlphaGeometry由两部分组成,一个是快速、直观的语言模型系统——GPT-f,另一个是较慢、更具分析性的“符号引擎”系统。
面对一道奥数几何题,AlphaGeometry首先利用GPT-f提出要尝试的定理和论点,接着“符号引擎”就会通过逻辑推理,按照数学规则构建GPT-f提出的论点。两个系统协同工作、不断切换,直到问题解决。
Luong表示,虽然AlphaGeometry在解决奥数几何题方面非常成功,但它的答案往往比人类的证明更长。不过,它可以发现一些人类遗漏的东西。比如,它对一道2004年奥数竞赛题的解法,比官方给出的答案更好、更通用。
英国伦敦数学科学研究所的何杨辉指出,该系统在可用的数学运算方面存在固有的局限性,因为奥数问题应该用大学本科阶段以下教授的定理来解决。因此,增加AlphaGeometry可以获得的数学知识能够改善系统,甚至有助于它取得新的数学发现。
目前,DeepMind拒绝透露是否计划让AlphaGeometry参加奥数现场比赛,以及是否再扩展该系统以解决其他非几何奥数问题。
(徐锐)
相关论文信息:
https://doi.org/10.1038/s41586-023-06747-5
本文链接:http://knowith.com/news-7-141.html接近金牌水平,AI向人类奥数“下手”
声明:本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。
【申报】关于申报2024年度朝阳区促进生活性服务业发展引导资金项目的通知
关于确定国家知识产权强市建设试点示范城市、强县建设试点示范县的通知(国知发运字〔2024〕2号)
【解读】《海关总署关于失信企业认定标准相关事项的公告》政策解读——案例篇
【解读】证监会就《上市公司向特定对象发行可转换公司债券购买资产规则(征求意见稿)》公开征求意见
界别联组会上委员共议 高质量推进北京国际科创中心建设
五部门开展智能网联汽车“车路云一体化”应用试点工作
对十四届全国人大一次会议第2188号建议的答复
推动科技向善 把好伦理“方向盘”——科技部有关负责人解读《科技伦理审查办法(试行)》
北京培育建设国际消费中心城市2024年工作要点
图说外观设计|一图概览外观设计本国优先权制度
天平:京东白条的加油额度怎么用,轻松7种流程方法
持之以恒:羊小咩的钱怎么套出来(新手必学的5个秒到方法)
秒懂:白条怎么快速套出来-本文详细讲解过程步骤
火-微信分付提现5个方法提现—分付简单“4个步骤”打造秒到账
一览官宣发布:2025索托拉西布多少钱一盒?国内代购老挝孟加拉/印度索托拉西布价约1900元汇总
顶天立地:上海代还信用卡垫还,自己套出来现金(教你5个操作方法)
大智若愚:成都简阳市信用卡垫还公司秒到账(用7个流程步骤)
积极进取:苹果id贷申请入口,抵押苹果id贷款
惊奇:珠海香洲区哪家可以套visa卡记得点赞!
轻松掌握:HB信用购怎么套出来(5个最新取现方法)