人工智能突破挑戰深度學習規範
人工智能突破挑戰了深度學習規範,聚焦於人工智能研究的破壞性轉變。基於強化學習,利用因果推理和世界模型的力量的新型模型正在重塑對AI可以實現的目標。與傳統的深度學習相比,這些模型在從模擬機器人技術到復雜的視頻遊戲等環境中的表現都優於環境中,證明了顯著改善的概括和決策。通過在包括DeepMind和學術研究實驗室在內的頂級機構的合作開發,這項創新涉及現代AI的長期局限性,它很難適應不熟悉的場景。隨著這種新的範式獲得了吸引力,它可能會重新定義智能係統的界限,並增強甚至取代深度學習為主要的AI方法。
關鍵要點
- 利用世界模型和因果推斷的基於增強學習的模型,挑戰了長期以來的深度學習方法。
- 它表明在包括機器人和視頻遊戲在內的各種環境中的強大概括能力和決策。
- 來自DeepMind和其他領先機構的研究人員強調了其信譽和科學意義。
- 該模型解決了深度學習的關鍵局限性,尤其是在分佈外的概括中。
了解傳統深度學習的局限性
十多年來,深度學習一直在AI景觀中佔據主導地位,在自然語言處理,圖像識別和遊戲中提供了令人印象深刻的基準。但是,它並非沒有局限性。其中的主要是它在以前從未見過的情況下的表現不佳,稱為分佈概括。神經網絡需要大量的數據集,並且經常難以推斷其培訓數據。當將它們應用於機器人技術或自動駕駛的動態現實環境時,這會使它們變得脆弱,在這種環境中不斷出現。
深度學習模型也缺乏足夠的解釋性,並且在很大程度上取決於反複試驗的優化。這些系統不會在決策中納入結構化推理或對因果關係的理解。這些要素對於以魯棒性和適應性來建立通用智能至關重要。有關更多洞察力,請參閱深度學習是什麼以及它與AI的不同之處的細分。
在AI中輸入世界模型和因果推斷
研究人員現在正在探索模仿代理商如何與環境相互作用的替代框架。一個有希望的途徑是使用世界模型,這是環境行為的緊湊內部表示。這些模型允許AI代理在選擇如何進行之前模擬可能的行動結果,從而導致更有效的計劃和學習策略。
這是增強學習起著核心作用的地方。與深度學習的被動數據消耗不同,強化學習者會積極探索自己的世界並根據反饋來調整行為。當包括因果推理方法時,代理會獲得推理一個變量如何隨著時間影響另一個變量的能力。他們不僅了解模式,而且了解這些模式背後的結構力學。這大大促進了以前看不見的場景中的概括和決策。
現實世界應用:從模擬物理學到機器人技術
DeepMind和EthZürich的最新工作使這種模型在復雜的環境中栩栩如生。在高級機器人模擬中,接受世界模型訓練的代理在動態條件下表現出敏捷性和適應性。任務的範圍從不穩定的表面上行走到解決每個情節中佈局的迷宮。
一個特別令人印象深刻的案例涉及一個四倍的機器人,通過在表演前在內部模擬物理相互作用來導航不規則的地形。該技術除了傳統的深度學習外,通常需要靜態的環境假設來產生可行的政策。通過在內部預測幾個未來的步驟,該代理可以達到近乎人類的適應性水平。這些系統從反應轉變為預測,提供了明顯的性能和彈性。一些研究人員認為,這一進步強烈支持能夠通過探索獲得能力的自學成熟的AI系統的發展。
變壓器模型與世界模型:每個模型都擅長
GPT和BERT等變壓器體系結構對該領域有了深遠的影響,尤其是在與語言有關的任務中。這些模型通過通過應用於大規模數據集的自我注意力的機制來識別長期依賴性來表現出色。他們的成功在很大程度上是統計的,依靠數據豐度來推斷模式。
世界模型採用不同的路線。他們不僅觀察到;他們與環境互動,模擬和理由。這使他們更加與機器人操縱或自動駕駛汽車(適應新條件至關重要的自動駕駛車輛)等實時任務更加一致。變壓器仍然是具有穩定輸入輸出映射的任務的理想選擇,而世界模型則占主導地位的環境,使代理商可以從錯誤和新信息中學習。研究人員越來越多地探索將基於變壓器的架構與這些動態系統的預測組件相結合的混合方法。持續的演變標誌著邁向新的智力時代的一步,其中模式識別和因果學習是同時運作的。
科學信譽:由領先的AI機構支持
總理機構的貢獻增強了這種新方法的可信度。 DeepMind,EthZürich和蒙特利爾大學發表了研究,表明使用這種方法可以令人信服地表現更好。在Neurips 2023和ICLR 2024上提出的研究提供了可重現的基準測試,以支持複雜系統中改善概括和決策計劃的主張。
AI空間中的思想領導者表示支持這個方向。戴維·哈(David Ha)是Google Brain的主角,目前在Sakana AI中,他強調了世界模型提供的富有想像力的方面。他指出,這些系統允許代理在作用前預測結果,這是從僅複製觀察到的數據的根本轉變。深度學習的先驅Yoshua Bengio還敦促該領域採用結構化推理技術來解決當前的局限性。對於那些應對智能係統的含義的人來說,道德方面同樣重要。探索AI及其道德的並發症,以了解更廣泛的社會影響。
技術常見問題解答:解釋的核心概念
什麼是人工智能中的世界模型?
世界模型是一種內部表示,可以通過模擬其環境的未來狀態來幫助AI預測其行動的後果。它充當內存和推理引擎,讓系統計劃。
機器學習的因果推斷是什麼?
因果推理允許AI系統區分相關性和因果關係。它支持深厚的推理和計劃,尤其是在評估其他可能性時。
強化學習與深度學習有何不同?
深度學習通過使用大數據集近似輸入和輸出之間的映射來構建功能。相比之下,增強學習依賴於反饋循環。代理商通過在環境中行事並調整行為以隨著時間的推移最大化獎勵來學習。
這些替代方案可以完全取代深度學習嗎?
不,深度學習對於視覺和語言等感官處理仍然是必不可少的。但是,加強學習和因果模型更適合需要適應,互動或解釋的任務。結合兩種方法的系統可能最有效。
展望:邁向混合情報系統
混合AI系統的開發似乎很可能。深度學習有助於強大的感知,同時加強學習與因果推論相結合,可以增加適應性和遠見。這些功能共同支持可以以復雜方式看到,思考和行動的代理。這種進化可以重塑包括醫療保健,物流,教育和氣候建模的行業。
隨著世界模型研究背後的勢頭和備受矚目的機構的產生,基於增強的系統可能很快成為主流AI的關鍵組成部分。這是重新定義機器智能的關鍵時刻。有關AI研究的道德方向的更多信息,請探索領先組織在AI道德上進行的投資。