DeepMind再突破：AlphaGeometry2破解复杂几何题

摘要： 谷歌DeepMind发布了AlphaGeometry2，一款能够解决复杂几何问题的AI系统。该系统结合了神经符号方法，在国际数学奥林匹克竞赛（IMO）的几何问题中表现出色，解题率超越了金牌得主的平均水平。AlphaGeometry2的推出，不仅为数学竞赛选手提供了强大的工具，也为数学教育和研究带来了新的可能性。

正文：

人工智能（AI）在各个领域的应用日益广泛，如今，它甚至开始挑战人类在数学领域的优势。谷歌DeepMind最新推出的AlphaGeometry2，正是这样一款令人瞩目的AI系统。它专门用于解决国际数学奥林匹克竞赛（IMO）中的几何问题，其卓越的解题能力令人印象深刻。

AlphaGeometry2的核心在于其独特的神经符号方法。它巧妙地结合了谷歌Gemini系列的语言模型与符号引擎，实现了优势互补。Gemini模型通过神经网络预测解题所需的几何构造，例如点、线、圆等，而符号引擎则基于严格的数学规则进行推理和证明。这种结合使得AlphaGeometry2既具备了强大的直觉能力，又保证了逻辑的严密性。

在过去25年的IMO几何问题中，AlphaGeometry2取得了84%的解题率，这一成绩超越了金牌得主的平均水平。这一成就的背后，是DeepMind团队对AlphaGeometry2进行的一系列核心升级。这些升级包括：

扩展的领域专用语言： 系统扩展了原始的AlphaGeometry语言，使其能够处理涉及物体运动以及包含角度、比例和距离线性方程的更难问题。
更强大的符号推理引擎DDAR2： DDAR2（Deductive Database Arithmetic Reasoning）是一种计算演绎闭包的算法，能够从一组初始事实出发，通过固定的推理规则逐步推导出所有可能的事实，直到无法再推导为止。DDAR2的改进包括处理重合点的能力、更快的算法实现（从Python改为C++，速度提升300倍），以及更高效的规则应用。
全新的搜索算法SKEST： AlphaGeometry2使用SKEST（基于知识共享集成的搜索树）的搜索算法。算法通过多个配置不同的搜索树并行运行，每个节点对应一次辅助构造尝试和符号引擎的运行。如果尝试成功，则所有搜索树终止；如果失败，成功证明的事实会被记录到共享事实库中，供其他节点使用。
更强大的语言模型： 采用更先进的语言模型，提升了对几何问题的理解和推理能力。

为了训练AlphaGeometry2，DeepMind团队还创造性地生成了超过3亿个不同复杂度的定理和证明，用于训练数据。这种合成数据训练的方式，有效解决了几何问题训练数据匮乏的难题。

AlphaGeometry2的应用前景十分广阔。除了在数学竞赛中发挥作用外，它还可以作为数学教育中的辅助工具，帮助学生和教师更好地理解和解决复杂的几何问题。通过展示解题过程和逻辑推理，AlphaGeometry2能够为学生提供学习和练习的范例。此外，AlphaGeometry2的技术还可以扩展到数学研究领域，为数学家提供新的思路和方法，帮助解决尚未解决的几何问题。结合AlphaProof等其他AI模型，AlphaGeometry2甚至可以用于形式化数学推理。

更进一步，AlphaGeometry2的技术还可以扩展到科学和工程领域，例如在复杂的工程计算中提供几何推理支持。

AlphaGeometry2的成功，再次证明了AI在解决复杂问题方面的巨大潜力。随着AI技术的不断发展，我们有理由相信，它将在更多的领域为人类带来惊喜。

结论：

AlphaGeometry2的推出，是AI领域的一项重要突破。它不仅在解决几何问题方面表现出色，更重要的是，它为我们展示了AI在数学教育、研究以及更广泛的科学和工程领域的应用前景。随着AI技术的不断进步，我们期待看到更多类似AlphaGeometry2的创新成果，为人类社会的发展做出更大的贡献。

参考文献：