引入和演變 生成的AI 如此突然和激烈,以至於很難充分理解這項技術改變了我們的生活。
放大到三年前。是的,至少在理論上,人工智學變得越來越普遍。越來越多的人知道它可以做的事情,儘管即使存在人們對AI能力的巨大誤解。不知何故,這項技術的同時還不夠,並且對實際實現的目標過多。儘管如此,普通人仍然可以指出至少一個AI工作的領域,執行高度專業的任務 相當不錯,在高度控制的環境中。除此之外,任何東西還是仍然在研究實驗室中,或者根本不存在。
將其與今天進行比較。除了寫句子或提出問題的能力以外,零技能,世界正處於我們的觸角。我們可以生成真正獨特而令人驚奇的圖像,音樂,甚至是電影,並具有破壞整個行業的能力。我們可以提出搜索引擎流程,問一個簡單的問題,即如果正確的框架可以生成足夠好的自定義內容的頁面,可以通過大學培訓的學者……或者如果我們指定POV,則可以通過平均的三年級生。儘管它們以某種方式在短短一兩年內變得司空見慣,但幾年前,這些能力絕對不可能。生成AI的領域存在,但沒有以任何方式脫離。
如今,許多人已經嘗試了生成的AI,例如Chatgpt,Midjourney或其他工具。其他人已經將它們納入了他們的日常生活中。這些發展的速度正在起泡,直到幾乎令人震驚。鑑於過去六個月的進步,毫無疑問,在接下來的幾年中,我們將一遍又一遍地吹走。
生成AI中起作用的一種特定工具是進行檢索增強發電(RAG)系統的性能及其思考特別複雜的查詢能力。引入 幀 數據集,詳細說明 文章 關於評估數據集的工作原理,既顯示了現在的最新技術狀況以及它的發展位置。即使自2024年底引入幀以來,許多平台已經打破了他們通過困難且複雜的查詢推理能力的新記錄。
讓我們深入了解哪些框架的意圖以及不同的生成AI模型的性能。我們可以看到權力下放和開源平台如何不僅保持自己的立場(尤其是 有感覺的聊天),他們允許用戶清楚地了解某些AI模型能夠實現的驚人推理。
幀數據集及其評估過程的重點是824個“多跳”問題,旨在進行推理,邏輯連接點,使用多種不同來源檢索關鍵信息的功能以及將它們全部拼湊在一起以回答問題的能力。這些問題需要在兩個和15個文檔之間正確回答它們,還有目的地包括約束,數學計算和推論以及處理基於時間的邏輯的能力。換句話說,這些問題非常困難,實際上代表了人類可能在互聯網上進行的非常真實的研究。我們一直在處理這些挑戰,必須在互聯網來源的海洋中搜索分散的關鍵信息,根據不同的網站將信息拼湊在一起,通過計算和推導來創建新信息,並了解如何將這些事實整合到問題的正確答案中。
研究人員發現數據集首次發布和測試時發現的是頂部 Genai模型 當他們不得不使用單步方法回答時,他們能夠有些準確(約40%),但是如果允許允許所有必要的文檔回答問題,則可以達到73%的精度。是的,有73%的人似乎不像是一場革命。但是,如果您確切了解必須回答的問題,那麼這個數字將變得更加令人印象深刻。
例如,一個特別的問題是:“該樂隊的樂隊負責人最初在坎耶·韋斯特(Kanye West)的歌曲《力量誕生》中表演了這首歌?”人類將如何解決這個問題?該人可能會看到他們需要收集各種信息元素,例如坎耶·韋斯特(Kanye West)歌曲的歌詞,稱為“ Power”,然後能夠瀏覽歌詞並確定歌曲中實際上採樣另一首歌的觀點。作為人類,我們可能會聽這首歌(即使對此不熟悉),並能夠分辨出何時採樣另一首歌。
但是請考慮一下:Genai在“聆聽”時必須做些什麼才能檢測到原始歌曲以外的其他歌曲?這是一個基本問題成為對真正智能AI的絕佳考驗的地方。而且,如果我們能夠找到這首歌,聽聽並確定歌詞采樣,那隻是第1步。我們仍然需要找出歌曲的名字是什麼,樂隊是什麼,那個樂隊的領導者是誰,然後那個人出生了。
框架表明,要回答現實的問題,需要大量的思考處理。這裡有兩件事。
首先,能力 分散的 Genai模型不僅要競爭,而且可能主導結果,這是令人難以置信的。越來越多的公司正在使用分散的方法來擴展其處理能力,同時確保大型社區擁有該軟件,而不是將無法分享其進步的集中式黑匣子。像困惑和有意識之類的公司正在領導這一趨勢,每個公司都具有強大的模型,在釋放框架時的第一個準確性記錄都高於第一個準確的記錄。
第二個要素是,這些AI模型中的較小數量不僅是分散的,而且是開源的。例如,既有聲音聊天又是早期測試,這表明其推理的複雜性,這要歸功於寶貴的開源訪問。上面的框架問題使用與人類使用的幾乎相同的思考過程回答,其推理細節可供審查。也許更有趣的是,它們的平台是許多模型,這些模型可以微調給定的視角和性能,儘管某些Genai模型中的微調過程導致精度降低。在有意義的聊天的情況下,已經開發了許多不同的模型。例如,最近一個名為“ Dobby 8B”的模型能夠優於框架基準,同時也發展了獨特的親晶體和親釋放態度,該態度會影響該模型的觀點,因為它可以處理信息部分並開發答案。
所有這些驚人的創新的關鍵是使我們在這裡的快速速度。我們必須承認,隨著這項技術發展的速度,它只會在不久的將來更快地發展。我們將能夠看到,尤其是通過分散和開源的Genai模型,在系統的智能開始超越我們自己的智能,以及對未來意味著什麼,這是至關重要的閾值。