DeepSeek:效率提高,不是AI創新的範式轉變

鑑於它帶給該空間的效率顯著提高了,圍繞高級大語模型(LLM)的最新興奮是可以理解的。但是,對其釋放的一些反應似乎誤解了其影響的幅度。 DeepSeek代表了LLM開發的預期軌蹟的飛躍,但並不意味著革命性的轉變向人工通用智能(AGI),也沒有標誌著AI創新的重力中心突然轉變。

相反,DeepSeek的成就是沿著良好的道路的自然發展,這是AI技術的指數增長之一。這不是破壞性的範式轉變,而是對技術變革加速速度的有力提醒。

DeepSeek的效率提高:沿預期軌蹟的飛躍

圍繞DeepSeek的興奮的核心在於其令人印象深刻的效率提高。它的創新在很大程度上是要使LLMS更快,更便宜,這對AI模型的經濟學和可及性具有重要意義。但是,儘管嗡嗡作響,這些進步並不是從根本上進行的,而是現有方法的改進。

在1990年代,高端計算機圖形渲染所需的超級計算機。如今,智能手機能夠執行相同的任務。同樣,面部識別(一旦是利基市場,高成本的技術)現在已成為智能手機中無處不在的現成功能。 DeepSeek符合這種技術模式:對現有功能的優化,可提供效率,但不是一種新的開創性方法。

對於那些熟悉技術增長原則的人來說,這種快速進步並不意外。在AI等關鍵領域中提出進步的技術奇異性理論預測,隨著我們接近奇異之地,突破將變得更加頻繁。 DeepSeek只是這一持續趨勢的一刻,其作用是使現有的AI技術更容易訪問和高效,而不是代表突然飛向新能力。

DeepSeek的創新:建築調整,不是AGI的飛躍

DeepSeek的主要貢獻是優化大型語言模型的效率,尤其是通過其專家(MOE)體系結構的混合。 MOE是一項完善的合奏學習技術,多年來一直在AI研究中使用。 DeepSeek做得特別好的是完善此技術,並結合了其他效率措施,以最大程度地降低計算成本並使LLMS更實惠。

  • 參數效率:DeepSeek的Moe設計在任何給定時間僅激活其6710億個參數中的370億,將計算要求僅減少到傳統LLM的1/18。
  • 推理的強化學習:DeepSeek的R1模型使用增強學習來增強思想鏈推理,這是語言模型的重要方面。
  • 多訓練訓練:DeepSeek-V3預測多個文本的能力同時提高了培訓的效率。

與Openai或Anthropic這樣的競爭對手相比,這些改進使DeepSeek模型在訓練和跑步時急劇便宜。儘管這是LLM的可訪問性邁出的重要一步,但它仍然是工程的完善,而不是對AGI的概念突破。

開源AI的影響

DeepSeek最著名的決定之一是將其型號開源 – 與Openai,Anthropic和Google等公司的專有,圍牆的方法明顯不同。這種開源方法在Meta的Yann Lecun等AI研究人員的支持下,培養了一個更加分散的AI生態系統,在該系統中,創新可以通過集體發展蓬勃發展。

DeepSeek的開源決定背後的經濟原理也很明確。開源AI不僅是一種哲學立場,而且是商業策略。通過向廣泛的研究人員和開發人員提供技術,DeepSeek將自己定位為受益於服務,企業集成和可擴展的託管,而不是僅依靠專有模型的銷售。這種方法使全球AI社區獲得了競爭性工具的訪問,並減少了大型西方科技巨頭在該領域的束縛。

中國在AI種族中的作用日益增長

對於許多人來說,DeepSeek的突破來自中國這一事實可能令人驚訝。但是,不應震驚或作為地緣政治競賽的一部分來看待這一發展。已經花了多年的時間觀察了中國的人工智能景觀,很明顯,該國已經對AI研究進行了大量投資,從而導致了越來越多的人才和專業知識。

與其將這一發展作為對西方主導地位的挑戰,不如將其視為AI研究日益全球性質的標誌。公開合作,不是民族主義競爭,是邁向AGI負責任和道德發展的最有希望的途徑。分散的,全球分佈的努力更有可能產生一種受益於所有人類的AGI,而不是為單個國家或公司的利益而產生的AGI。

DeepSeek的更廣泛含義:超越LLM

儘管圍繞DeepSeek的許多興奮圍繞著LLM空間的效率展開,但要退後一步並考慮這一發展的更廣泛含義至關重要。

儘管具有令人印象深刻的功能,但基於變壓器的模型(例如LLM)仍無法實現AGI。他們缺乏基本的素質,例如紮根的構圖抽象和自我指導的推理,這對於通用智力來說是必不可少的。儘管LLM可以自動化廣泛的經濟任務並融入各種行業,但它們並不代表AGI開發的核心。

如果AGI在未來十年內出現,則不太可能純粹基於變壓器體系結構。諸如Opencog HyperON或神經形態計算之類的替代模型對於實現真正的通用智能可能更為基礎。

LLMS的商品化將改變AI投資

DeepSeek的效率提高了LLM商品化的趨勢。隨著這些模型的成本繼續下降,投資者可能會開始超越傳統的LLM架構,以實現AI的下一個重大突破。我們可能會看到,資金向AGI體系結構的轉變超出了變形金剛,以及對替代AI硬件的投資,例如神經形態芯片或關聯處理單元。

權力下放將影響AI的未來

隨著DeepSeek的效率提高使部署AI模型變得更加容易,它們也為分散AI體系結構的更廣泛趨勢做出了貢獻。側重於隱私,互操作性和用戶控制,分散的AI將減少我們對大型集中科技公司的依賴。這種趨勢對於確保AI滿足全球人口的需求至關重要,而不是由少數強大的參與者控制。

DeepSeek在AI Cambrian爆炸中的位置

總之,儘管DeepSeek是LLM效率的主要里程碑,但它並不是AI景觀的革命性轉變。相反,它沿著完善的軌跡加速了進步。在多個領域感受到了DeepSeek的廣泛影響:

  • 對現任者的壓力:DeepSeek挑戰Openai和Anthropic等公司,以重新考慮其商業模式並找到新的競爭方式。
  • AI的可訪問性:通過使高質量的模型更加負擔得起,DeepSeek將獲得尖端技術的訪問人數民主化。
  • 全球競爭:中國在人工智能發展中的作用越來越大,這表明了全球創新的本質,而這不僅限於西方。
  • 指數進步:DeepSeek是一個明確的例子,說明了AI的進步如何成為常態。

最重要的是,DeepSeek提醒您,儘管AI迅速發展,但真正的AGI可能會通過新的基礎方法而不是優化當今的模型來出現。當我們走向奇異之處時,至關重要的是確保AI開發保持分散,開放和協作。

DeepSeek不是AGI,但它代表著正在進行的變革性AI的旅程中邁出的重要一步。

Source link

Scroll to Top