Flash 1.5,Gemma 2和Project Astra

1.5 Flash在摘要,聊天應用程序,圖像和視頻字幕,從長文檔和表中提取數據等等。這是因為它是由1.5 Pro通過稱為“蒸餾”的過程對其進行培訓的,在該過程中,來自較大模型的最重要的知識和技能將轉移到較小,更高效的模型中。

在Gemini Technology頁面上的我們更新的Gemini 1.5技術報告中閱讀有關1.5 Flash的更多信息,並了解1.5 Flash的可用性和價格。

顯著改善1.5 Pro

在過去的幾個月中,我們已經顯著提高了1.5 Pro,這是我們在各種任務中進行一般績效的最佳模型。

除了將其上下文窗口擴展到200萬個令牌外,我們還通過數據和算法進步增強了其代碼生成,邏輯推理和計劃,多轉交談以及音頻和圖像理解。我們看到這些任務中的每一個都在公共和內部基準方面有了很大的改進。

1.5 Pro現在可以遵循越來越複雜和細微的指令,包括指定涉及角色,格式和样式的產品級別行為的說明。我們已經改善了對模型對特定用例的響應的控制,例如通過多個功能調用來製定聊天代理的角色和響應樣式或自動化工作流程。我們已經通過設置系統說明來使用戶能夠指導模型行為。

我們在Gemini API和Google AI Studio中添加了音頻理解,因此1.5 Pro現在可以在Google AI Studio中上傳的視頻中遍及圖像和音頻。現在,我們將1.5 Pro集成到Google產品中,包括Gemini Advanced和Workspace應用程序。

在我們更新的Gemini 1.5技術報告和Gemini Technology頁面中閱讀有關1.5 Pro的更多信息。

雙子座納米了解多模式輸入

Gemini Nano正在擴展僅限文本輸入,還包括圖像。從Pixel開始,使用Gemini Nano具有多模式的應用程序將能夠以人們的方式理解世界 – 不僅是通過文本,而且通過視覺,聲音和口語。

在Android上閱讀有關Gemini 1.0 Nano的更多信息。

Source link

Scroll to Top