Alphageometry2:在幾何學上超過人類奧林匹克冠軍的AI

人工智能長期以來一直試圖模仿人類般的邏輯推理。儘管它在模式識別方面取得了巨大進展,但抽象的推理和象徵性推論仍然是AI的艱鉅挑戰。當AI用於數學問題解決問題時,這種限制變得尤為明顯,該學科長期以來證明了人類認知能力,例如邏輯思維,創造力和深刻的理解。與依賴公式和代數操縱的數學分支不同,幾何形狀不同。它不僅需要結構化的,逐步的推理,還需要識別隱藏關係的能力以及構建解決問題的額外元素的技能。

長期以來,這些能力被認為是人類獨有的。但是,Google DeepMind一直在開發可以解決這些複雜推理任務的AI。去年,他們引入了AlphageMetry,這是一種AI系統,將神經網絡的預測能力與符號推理的結構化邏輯相結合,以解決複雜的幾何問題。該系統通過解決54%的國際數學奧林匹克(IMO)幾何形狀問題,以與銀牌得主的表現達到績效,從而產生了重大影響。最近,他們使用Alphageometry2進行了進一步的進一步,該Alphageometry2的求解率令人難以置信,以優於普通的IMO金牌得主。

在本文中,我們將探討有助於Alphageometry2實現這種績效水平的關鍵創新,以及這種發展對AI在解決複雜推理問題方面的未來意味著什麼。但是,在研究使Alphageometry2與眾不同的原因之前,首先要了解什麼是字母測定法以及其工作原理。

字母計量學:在幾何問題解決問題中開創AI

字母計量法是一種AI系統,旨在解決IMO級別的複雜幾何問題。它基本上是一種神經符號系統,將神經語言模型與象徵性扣除引擎相結合。神經語言模型有助於系統預測新的幾何結構,而符號AI則應用正式邏輯來生成證據。這種設置允許載流量計通過結合神經網絡的模式識別能力,從而更像人類,從而復制直覺的人類思維,並與形式邏輯的結構化推理,這些邏輯模仿了人類的演繹推理能力。字母測定法的關鍵創新之一是如何生成培訓數據。它不依靠人類的示範,而是創建了十億個隨機幾何圖和點與線之間的系統得出的關係。這個過程創建了一個大量的數據集,其中包括1億個獨特的示例,幫助神經模型預測功能幾何構造,並將符號引擎引導到準確的解決方案。這種混合方法使載流量計能夠解決標準競爭時間內的30個奧林匹克幾何問題中的25個,與頂級人類競爭者的表現非常匹配。

Alphageometry2如何提高性能

雖然載流量計在AI驅動的數學推理中是一個突破,但它具有一定的局限性。它努力解決複雜的問題,缺乏處理廣泛的幾何挑戰的效率,並且在問題覆蓋範圍內有局限性。為了克服這些障礙,Alphageometry2引入了一系列重大改進:

  1. 擴大AI了解更複雜的幾何問題的能力

Alphageometry2中最重要的改進之一是它可以解決更廣泛的幾何問題。以前的載字母度計在涉及角度,比率和距離的線性方程以及需要推理的移動點,線和圓圈的問題上掙扎。 Alphageometry2通過引入更高級的語言模型來克服這些局限性,該模型使其可以描述和分析這些複雜的問題。結果,它現在可以解決過去二十年來所有IMO幾何問題的88%,與前66%相比顯著增加。

  1. 更快,更有效的解決問題的引擎

Alphageometry2表現出色的另一個關鍵原因是其改進的符號發動機。該引擎是該系統的邏輯核心,已通過多種方式增強。首先,使用更精緻的解決問題的規則可以改善,這使其更有效,更快。其次,它現在可以識別出不同的幾何構建體何時代表問題中同一點,從而使其更靈活地推理。最後,該發動機以C ++而不是Python重寫,比以前快300倍以上。這種速度提高允許Alphageometry2更快,更有效地生成解決方案。

  1. 訓練AI具有更複雜和多樣化的幾何問題

Alphageometry2神經模型的有效性來自其在合成幾何問題方面的廣泛培訓。字母度最初產生了十億個隨機幾何圖,以創建1億個獨特的訓練示例。 Alphageometry2通過生成更廣泛,更複雜的圖表(包括複雜的幾何關係)來進一步。此外,它現在結合了需要引入輔助結構的問題,即有助於解決問題的點或線條,從而可以預測並生成更複雜的解決方案

  1. 通過更智能的搜索策略找到解決方案的最佳途徑

Alphageometry2的關鍵創新是其新的搜索方法,稱為搜索樹(Skest)的共享知識合奏。與依賴基本搜索方法的前身不同,Alphageometry2並行運行多個搜索,每個搜索都從其他搜索中學習。該技術使其能夠探索更廣泛的解決方案,並顯著提高AI在較短的時間內解決複雜問題的能力。

  1. 從更高級的語言模型中學習

Alphageometry2成功的另一個關鍵因素是它採用了Google的Gemini模型,Google的Gemini Model是一種最先進的AI模型,該模型已經接受了更廣泛,更多樣化的數學問題的培訓。這種新的語言模型提高了Alphageometry2由於改善了經過想法的推理而產生逐步解決方案的能力。現在,Alphageometry2可以以更結構的方式解決問題。通過微調其預測並從不同類型的問題中學習,該系統現在可以解決更大比例的奧林匹克級幾何問題。

取得超過人類奧林匹克冠軍的結果

得益於上述進步,Alphageometry2解決了2000 – 2024年的50個IMO幾何問題中的42個,達到了84%的成功率。這些結果超過了普通的IMO金牌得主的表現,並為AI驅動的數學推理樹立了新的標準。除了令人印象深刻的性能外,Alphageometry2還在自動化定理方面取得了長足的進步,使我們更接近AI系統,不僅可以解決幾何問題,而且還以人類可以理解的方式解釋了它們的推理

數學推理中AI的未來

從字母計量學到alphageometry2的進展表明,AI在處理需要深入思考,邏輯和策略的複雜數學問題方面如何變得更好。它還表示AI不再只是識別模式,它可以推理,建立聯繫並以感覺更像人類邏輯推理的方式解決問題。

Alphageometry2還向我們展示了AI將來的能力。 AI不僅遵循指示,還可以自行探索新的數學思想,甚至可以幫助科學研究。通過將神經網絡與邏輯推理相結合,AI可能不僅是一種可以自動化簡單任務的工具,還可以是一個合格的合作夥伴,可以幫助擴大依靠批判性思維的領域中的人類知識。

我們可以進入一個AI證明定理並在物理,工程和生物學方面發現新發現的時代嗎?隨著AI從蠻力計算轉變為更周到的解決問題,我們可能正處於未來的邊緣,即人類和人工智學共同努力,以揭示我們從未想到的想法。

Source link

Scroll to Top