Google AI發布了Gemma 3:輕巧的多模式開放型號,以實現高效和駐留AI

在人工智能領域,仍然存在兩個持續的挑戰。許多高級語言模型需要大量的計算資源,這限制了小型組織和個人開發人員的使用。此外,即使這些型號可用,它們的延遲和尺寸也常常使它們不適合在筆記本電腦或智能手機等日常設備上部署。還需要進行適當的風險評估和保障措施,以確保這些模型可以安全運行。這些挑戰激發了人們在不損害性能或安全性的情況下既有高效又可以訪問的模型的搜索。

Google AI發布了Gemma 3:開放模型的集合

Google DeepMind推出了Gemma 3,這是一個旨在應對這些挑戰的開放模型家族。 Gemma 3具有類似於Gemini 2.0的技術,旨在在單個GPU或TPU上有效運行。這些型號有各種尺寸(1B,4B,12B和27B),並提供了預先訓練和指導性變體的選項。該範圍使用戶可以選擇最適合其硬件和特定應用程序需求的模型,從而使更廣泛的社區更容易將AI納入其項目。

技術創新和關鍵好處

Gemma 3旨在在幾個關鍵領域提供實際優勢:

  • 效率和便攜性: 這些型號旨在快速在適度的硬件上運行。例如,27B版本在評估中表現出了強勁的性能,同時仍然能夠在單個GPU上運行。
  • 多模式和多語言功能: 4b,12b和27b模型能夠處理文本和圖像,從而實現可以分析視覺內容和語言的應用程序。此外,這些模型支持140多種語言,這對於為多種全球受眾提供服務非常有用。
  • 擴展的上下文窗口: 借助上下文窗口為128,000個令牌(和1B型號的32,000個令牌),Gemma 3非常適合需要處理大量信息的任務,例如匯總冗長的文檔或管理擴展對話。
  • 高級培訓技術: 培訓過程結合了從人類反饋和其他培訓方法中學習的強化學習,這些方法有助於使模型的響應與用戶期望保持一致,同時保持安全性。
  • 硬件兼容性: Gemma 3不僅針對NVIDIA GPU進行了優化,還針對Google Cloud TPU進行了優化,這使其在不同的計算環境中適應。這種兼容性有助於降低部署高級AI應用程序的成本和復雜性。

績效見解和評估

對Gemma 3的早期評估表明,模型在其尺寸類別中的性能可靠。在一組測試中,27B變體在相關的排行榜上達到了1338的得分,這表明其能夠提供一致且高質量的響應而無需大量的硬件資源。基準還表明,這些模型可以有效地處理文本和視覺數據,這在一定程度上要歸功於通過自適應方法管理高分辨率圖像的視覺編碼器。

這些模型的培訓涉及文本和圖像的大量數據集 – 最大變體的文本和圖像數據集至14萬億個令牌。這種全面的培訓方案支持他們解決從語言理解到視覺分析的廣泛任務的能力。早期的Gemma模型的廣泛採用以及一個充滿活力的社區已經產生了許多變體,強調了這種方法的實際價值和可靠性。

結論:一種周到的開放,可訪問的AI的方法

Gemma 3代表了使高級AI更容易訪問的謹慎一步。這些型號有四種尺寸,能夠以140多種語言處理文本和圖像,可提供擴展的上下文窗口,並在日常硬件上進行了優化的效率。他們的設計強調了一種平衡的方法 – 延長了穩健的性能,同時還採取了確保安全使用的措施。

從本質上講,Gemma 3是解決AI部署長期挑戰的實用解決方案。它允許開發人員將復雜的語言和視覺功能集成到各種應用程序中,同時強調可訪問性,可靠性和負責任的用法。


查看 擁抱面孔和技術細節的模型。 這項研究的所有信用都歸該項目的研究人員。另外,請隨時關注我們 嘰嘰喳喳 而且不要忘記加入我們的 80k+ ml子列數

🚨 Meet Parlant:LLM優先的對話AI框架,旨在為開發人員提供對AI客戶服務代理商所需的控制和精確度,並利用行為指南和運行時監督。 🔧🎛️它是使用Python和TypeScript📦中易於使用的CLI📟和本機客戶sdks操作的。


Asif Razzaq是Marktechpost Media Inc.的首席執行官。作為一位有遠見的企業家和工程師,ASIF致力於利用人工智能的潛力來實現社會利益。他最近的努力是推出了人工智能媒體平台Marktechpost,該平台的深入覆蓋了機器學習和深度學習新聞,既在技術上都可以聽起來,既可以通過技術上的聲音,又可以被廣泛的受眾理解。該平台每月有超過200萬個觀點,說明了其在受眾中的受歡迎程度。

PARLANT:使用LLMS💬💬(晉升)建立可靠的AI AI客戶面對面的代理商

Source link

Scroll to Top