1. 首页>>分享

Google DeepMind的AlphaGeometry2攻克IMO几何难题,表现超越金牌得主

最困难的数学测试使人类高中学生的头痛 - 国际数学奥林匹克(IMO) - 被人工智能(AI)征服。

在最近发表的一项研究中,Google DeepMind团队说,他们的几何问题解决系统,字母测定法解决了84%(42/50)的几何难题,第一次超过了IMO平均金牌得主(40.9/50)。

此外,去年7月,Alphage计量法还“加入”了基于强化学习的正式数学推理系统的Alphaproof,当年IMO首次达到了银牌获得者的水平。

Alphageometry2是单载计量法的显着改进版本。它是一种神经符号混合系统,其语言模型基于双子座,并从头开始训练合成数据,这比其前身的数量级多。这有助于模型解决更具挑战性的几何问题,包括有关对象运动和角度,比例或距离的方程式。

Alphageometry2使用符号发动机两个数量级的速度比其前身快。面对新问题时,一种新颖的知识共享机制将用于实现不同搜索树的高级组合,以解决更复杂的问题。

作为回应,伦敦帝国学院的数学家凯文·巴扎德(Kevin Buzzard)评论说:“我认为很快,计算机将在IMO竞赛中获得完整的印记。”

相关的研究论文的标题为“用字母测定法解决奥林匹亚几何学的金医师表现”,并已在Preprint网站Arxiv上发表。

更强的数学推理,更快300倍

Alphageometry2(AG2)是由Google DeepMind开发的神经符号混合AI系统,旨在解决国际数学奥运会(IMO)中的几何问题。

AG2结合了语言模型(神经)和符号推理引擎(符号),并采用混合推理方法(神经符号方法)来解决几何问题。与其前身载量计(AG1)相比,AG2在问题解决率,搜索算法,语言模型和符号推理方面取得了重大改善,超过了IMO平均金牌得主的性能。

根据该论文,AG2已根据原始字母计量法(AG1)语言进行了扩展,以使其能够处理更复杂的几何问题,包括:

对象运动(基因座类型问题):AG2增加了与轨迹相关的谓词,从而使AI推理了几何对象(例如点,直线和圆形)的运动;

线性方程:AG2现在可以解析涉及角度,比例和距离的线性方程;

新的几何谓词:AG2语言添加了多个谓词,以支持更复杂的几何推理。

这些扩展将AG2语言的覆盖率从66%提高到88%,从而使其可以解决更多的IMO几何问题。

数学难题被攻克__数学天才做题

图|比较AG2与AG1(AC)的训练数据分布的比较:与AG1相比,AG2包含更复杂/更长的问题。在每种问题类型的示例分布中,B.AG2更加平衡; C.G2在于包含辅助点的证明与不包含辅助点的证明之间的比率更高)

此外,AG2还采用双子座语言模型,该模型具有比AG1更强的数学推理能力。该语言模型用于预测几何结构(例如辅助线,角度计算等),并有助于生成解决问题的步骤。它的培训数据包含3亿自动生成的定理和证明,从而大大扩展了AI的数学知识库。

同时,AG2采用了一种新的搜索算法(共享知识搜索树,Skest),引入了知识共享机制,结合了多个搜索树。与仅使用单个搜索策略的AG1相比,AG2允许不同的搜索路径可以共享经过验证的数学推理,从而显着提高了IMO竞争的解决方案能力。

_数学难题被攻克_数学天才做题

图|搜索算法的概述:将多个搜索树组合在一起,并通过特殊知识共享机制在其中共享推理

不仅如此,与AG1的符号引擎相比,AG2还将解决方案速度提高了300倍,并增加了处理“双点”的能力,这些功能可以解决一些需要构建多个相交点的问题。

探索可通用的AI

尽管AG2取得了突破性的进步,但仍然存在一些局限性。在AG2无法解决的问题中,无法解决6个IMO问题,因为它们涉及可变点,不平等和非线性方程的数量。因为AG2语言尚未支持这些类型; 2个问题涉及更先进的几何技术(例如反转,投影几何,根轴法),目前尚未在AG2的符号引擎中实现。

DeepMind团队表示,载流量计的未来改进方向将包括处理涉及不平等和非线性方程的数学问题,这对于“完全解决几何问题”至关重要。此外,自动数学公式化技术的进一步改进将使AI能够更准确地分析自然语言的数学问题,并且还在团队的计划中。

此外,研究表明,AG2不仅可以生成辅助结构,还可以得出完整的证据,这表明当前的语言模型有可能没有外部工具(例如符号推理引擎)独立。跑步。如果他们的愿景是正确的,那么解决问题的能力可能会成为未来通用人工智能(AGI)的重要组成部分。

Alphageometry2可能表明符号操作和神经网络的组合是探索广义AI的有前途的途径。实际上,根据DeepMind的论文,O1也具有神经网络体系结构,无法解决Alphageometry2可以回答的任何IMO问题。

参考链接:

本文来自由36KR出版的《微信》公共帐户,作者:Chen Xiaoyu。

本文采摘于网络,不代表本站立场,转载联系作者并注明出处:http://mjgaz.cn/fenxiang/274101.html

联系我们

在线咨询:点击这里给我发消息

微信号:13588888888

工作日:9:30-18:30,节假日休息