我国在通用人工智能逻辑推理领域实现重大跨越
我国科研团队开发出全球首个同时具备自主出题(Proposing)和自动解题(Solving)双重能力的通用人工智能系统——“通矩模型”(TongGeometry)。相关成果“基于引导树搜索的奥数几何问题提出与解答系统”(Proposing and solving olympiad geometry with guided tree search)1月26日发表于《自然·机器智能》(Nature Machine Intelligence)。
奥林匹克数学竞赛被视为人工智能逻辑推理能力的“试金石”。2024年初,DeepMind开发的AlphaGeometry曾引起全球轰动,展示了AI在解题方面的巨大潜力。然而,AlphaGeometry本质上是一个“被动解题者”,其训练极度依赖于大规模的合成数据和昂贵的计算资源。与之相比,我国科研团队自主研发的TongGeometry则展现出了更高维度的智能:它不仅是一个能够满分交卷的“优等生”,更是一位能够创造优美、新颖题目的“出题名师”。
论文第一作者、北京通用人工智能研究院张驰博士介绍:“我们在研究中发现了一个深刻的对偶性:当一个几何命题的证明难度显著高于其构建复杂度时,它便具备了作为奥赛题目的‘审美价值’。通过这种对偶关系的建模,TongGeometry能够从浩如烟海的空间组合中,精准捕捉到那些具备人类数学家审美标准的高质量题目。这在国际上首次实现了从‘模仿解题’到‘自主创造’的范式转变。”
在性能表现上,TongGeometry展现了极高的国产原创技术优越性。相比AlphaGeometry需要庞大的算力集群,TongGeometry仅需单张消费级显卡(如RTX 4090)即可在最多38分钟内,解决近25年所有的奥数几何难题,其推理效率和准确率均达到世界顶尖水平。此外,该系统通过创新的“规范化表示”技术,将搜索空间压缩了几个数量级,有效解决了传统方法中的路径爆炸问题。

北京大学助理教授张驰、朱毅鑫讨论TongGeometry算法。受访者供图
论文共同通讯作者、北京大学心理与认知科学学院助理教授朱毅鑫表示,TongGeometry的意义不仅在于解题速度的提升,更在于它通过模拟人类数学家的直觉和审美,实现了“小数据、大任务”的范式转化。这种不依赖海量标注数据、通过内部逻辑自我演化的路径,正是通用人工智能(AGI)发展的关键。“我们的系统不仅能与国际最先进的AI系统对标,更在理解逻辑底层美学和自主发现科学规律方面走在了前列。”他说。
目前,TongGeometry的原创能力已得到专业学术界和竞赛圈的认可。系统自主生成的3道几何新题,已正式入选2024年全国中学生数学联赛(北京赛区)及美国精英奥赛(Ersatz Math Olympiad),这是AI原创题目首次进入高规格人类数学竞赛。
这一成果标志着中国科研团队在自动化推理的逻辑核心领域实现关键技术自研,并在性能与功能多样性上全面超越了以DeepMind为代表的国际顶尖水平。该科研团队由北京通用人工智能研究院(BIGAI)、北京大学心理与认知科学学院、北京大学智能学院、北京大学人工智能研究院,以及北京大学武汉人工智能研究院联合组成,未来将继续深耕“通系列”通用智能模型,推动中国人工智能技术在更多复杂逻辑与科学发现领域实现领跑。
本文链接:http://knowith.com/news-1-14114.html我国在通用人工智能逻辑推理领域实现重大跨越
声明:本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。
辽宁考研机构实力排名?大连理工大学盘锦校区海洋工程研究生怎么样
湖南大学研究生学费(湖南大学研究生学费一年多少)
肇庆市考研考点有哪些学校(肇庆学院有研究生吗)
考研辅导培训班哪家好?武汉哪个考研辅导班比较好
管理类全国联考(管理类全国联考科目)
郑州可以读研的学校 河南考生考研是不是占优势
黄埔区和黄浦区一样吗 广州大学研究生院住宿条件怎么样
青岛即选计划(中国石油大学和青岛大学哪个好考研)
深圳emba学费多少 深圳读emba需要多少钱
河海大学机械工程怎么样,河海大学机械工程怎么样知乎
敞开2025!在国内购买印度维奈托克(维奈克拉)一盒多少钱
秒到账必看:DY月付TX秒回攻略教会你
新手必阅:羊小咩享花卡怎么最快取出来
三分钟必看篇:怎么找商家提白条