DarwinGödelMachine:一種自我提高的AI代理,使用基礎模型和現實基准進化代碼

簡介:傳統AI系統的限制

常規人工智能係統受其靜態架構的限制。這些模型在固定的,人工設計的框架內運行,部署後不能自主改進。相比之下,人類的科學進步是迭代和累積性的 – 每個進步基於先前的見解。 AI研究人員從這種連續改進模型中汲取靈感,現在正在探索進化和自我反射技術,這些技術使機器可以通過代碼修改和性能反饋來改進。

達爾文·戈德爾機器(DarwinGödelMachine):自我改善AI的實用框架

Sakana AI,不列顛哥倫比亞大學和媒介學院的研究人員介紹了 達爾文·戈德爾機器(DGM),一種旨在自主發展的新型自我修改AI系統。與依賴於可證明的修改的戈德爾機器(GödelMachine)這樣的理論結構不同,DGM包含經驗學習。該系統通過不斷編輯自己的代碼而演變,並在現實世界編碼基準(例如SWE-Bench和Polyglot)的性能指標的指導下發展。

基礎模型和進化AI設計

為了驅動這個自我完善循環,DGM使用冷凍 基礎模型 這有助於代碼執行和生成。它從能夠自我編輯的基本編碼劑開始,然後對其進行迭代修改以產生新的代理變體。如果這些變體顯示出成功的彙編和自我完善,則將評估並保留在檔案中。這個開放式搜索過程模仿了生物學演化 – 提供多樣性,並使以前的次優設計成為未來突破的基礎。

基準結果:驗證SWE基礎和Polyglot上的進度

DGM在兩個眾所周知的編碼基准上進行了測試:

  • SWE板凳:績效從20.0%提高到50.0%
  • 多面體:準確性從14.2%增加到30.7%

這些結果突出了DGM在不干預的情況下發展其體系結構和推理策略的能力。該研究還將DGM與缺乏自我修飾或探索能力的簡化變體進行了比較,證實這兩個要素對於持續的績效改善至關重要。值得注意的是,在多種情況下,DGM甚至超過了像Aider這樣的手動系統。

技術意義和局限性

DGM通過從邏輯證明轉移到證據驅動的迭代來代表對Gödel機器的實際重新解釋。它將AI改進視為搜索問題 – 通過反複試驗探索代理體系結構。該框架雖然仍在計算密集型且尚未與專家調整的封閉系統相提並論,但為軟件工程及其他方面的開放式AI進化提供了可擴展的途徑。

結論:邁向一般,自我發展的AI架構

DarwinGödel機器表明,AI系統可以通過代碼修改,評估和選擇的周期自主對自己進行自主改進。通過整合基礎模型,現實世界的基準和進化搜索原則,DGM展示了有意義的性能提高,並為更適應能力的AI奠定了基礎。儘管當前的應用僅限於代碼生成,但未來版本可能會擴展到更廣泛的領域,即更接近通用物質,自我改進的AI系統與人類目標保持一致。


tl; dr

  • 🌱 DGM是一個自我提高的AI框架 這通過代碼修改和基準驗證來演變編碼代理。
  • 🧠使用 冷凍基礎模型 和進化啟發的技術。
  • 📈在SWE板凳上(50%)和多面體(30.7%)上勝過傳統基線。

查看紙張和GitHub頁面 這項研究的所有信用都歸該項目的研究人員。另外,請隨時關注我們 嘰嘰喳喳 而且不要忘記加入我們的 95k+ ml子雷迪特 並訂閱 我們的新聞通訊


Marktechpost的諮詢實習生,IIT Madras的雙學位學生Sana Hassan熱衷於應用技術和AI來應對現實世界中的挑戰。他對解決實踐問題的興趣非常興趣,他為AI和現實生活中的解決方案的交集帶來了新的視角。

Source link

Scroll to Top