公告 人類推出Claude 2.1,開發工具 在生成AI景觀中邁出了重要的一步。在首次開發者會議上,Anthropic將創新引入了其Claude AI平台。這些更新包括一個200,000 token的上下文窗口,改進的分析功能以及新的開發人員工具和API。這些進步位置Claude 2.1是OpenAI的GPT-4和Google的雙子座的強大競爭對手。人類繼續專注於安全性和可擴展性,以滿足開發人員和企業用戶的需求。
關鍵要點
- 克勞德2.1 包括一個200k token的上下文窗口,更好的推理和減少的幻覺。
- 新開發人員工具 具有Claude API控制台和用於集成和工作流程管理的企業套件。
- 該模型使用 憲法AI框架 確保對齊,可靠性和安全性。
- Claude 2.1與諸如 Chatgpt Enterprise和Google Gemini 在功能和企業應用程序中。
另請閱讀:通過這個令牌解鎖區塊鏈的未來
Claude 2.1:鍵升級
Claude 2.1是迄今為止人道最有能力的AI模型。它將強烈的上下文理解與為安全和企業使用而建立的體系結構融合在一起。一個亮點是擴展 200,000 token上下文窗口。這使模型可以處理和分析跨越數百頁的內容。用例包括審查長長的法律文件,進行多源研究或單個提示進行財務審計。
與Claude 2.0相比,Claude 2.1顯示出較低的幻覺率。獨立評估估計減少將近兩倍。改進來自更好的模型校準,更清潔的數據輸入和憲法AI框架,該框架使用基於反饋的原理和結構化值指導行為。
性能比較
模型 | 上下文窗口 | 幻覺率(EST。) | 對準法 | 企業工具 |
---|---|---|---|---|
克勞德2.1 | 200k令牌 | 低的 | 憲法AI | 控制台,API,企業套件 |
Chatgpt Enterprise(GPT-4) | 32K令牌 | 中等的 | 從反饋中學習 | chatgpt業務功能 |
Google雙子座 | 多達32K令牌(謠言) | 中等的 | 道德AI實驗室監督 | 頂點AI工具 |
與Claude 2.1一起,人類發布了它的 Claude API控制台。此基於瀏覽器的接口可幫助開發人員測試提示,監視性能和具有高控制的模型。該界面顯示實時令牌用法,延遲數據和部署選項。這減少了入職挑戰,並支持更高級的開發工作流程。
Anthropic還推出了用於Python和TypeScript的SDK。這些工具有助於將Claude與後端系統,Web應用程序和數據平台集成在一起。開發人員可以配置模型以完成或基於聊天的響應。這使Claude適用於用例,例如客戶支持機器人或內部報告工具。
開發人員用例
- 攝取內部知識基礎以在實際公司環境中錨定響應
- 在訴訟工作流程中處理大型法律合同或案件文件
- 分析源代碼以註釋或建議改進舊系統
- 理解和導航完整研究檔案的建築助理
另請閱讀:擬人尋求20億美元的資金提升
對人工智能安全和憲法一致的承諾
擬人化的首席執行官達里奧·阿莫迪(Dario Amodei)強調,安全是公司的重點。與僅依靠人標記的訓練數據的模型不同,Claude 2.1使用了一種稱為憲法AI的不同方法。這種方法使用一組與憲法類似的原則來指導克勞德在復雜或敏感的情況下的行為。
目的是產生不僅聰明而且道德的反應。在決策可能具有法律或社會影響的領域,這種對齊系統在使用Claude時會降低風險。
另請閱讀:Amazon和Anthropic在AI超級計算機上的合作
行業比較和市場定位
OpenAI的GPT-4在業務和消費者應用中都獲得了吸引力。儘管如此,它還是比Claude 2.1更小的上下文窗口。在需要擴展文檔的記憶的情況下,管理多達200k代幣的能力為Claude帶來了主要優勢。這使處理財務歷史記錄,產品論文或協作數據記錄的用戶有益。
Claude 2.1似乎也比GPT-4的幻覺效果少,尤其是在諸如推理和分析之類的結構化任務中。公共基準研究尚未完全證實這些結果。 Google的雙子座可能通過TPU硬件和與Google Cloud生態系統的深層鏈接提供更快的響應時間。儘管如此,Claude還是為生成輸出量表設定了一個新的標準。
開發人員和行業反應
X和Hacker News等討論論壇上的開發人員對Claude的擴展上下文窗口充滿熱情。許多人稱讚API控制台的平穩體驗。一家LegalTech公司的一位高級開發商說:“有200k的令牌,克勞德(Claude)消化並總結了一場500頁的NDA批次。這節省了我們的幾週。”來自伯克利的AI研究人員說,如果證明在測試中可靠,憲法AI可以製定新的安全標準。
行業專家觀察到,擬人化正在從以研究為中心的球員轉變為準備廣泛採用的球員。 Claude 2.1將強大的技術功能與可用性相結合,這使其對法律,醫療保健,公共服務和技術開發等領域的公司有吸引力。
另請閱讀:NLP中的令牌化是什麼?
前面的道路
Anthropic在其第一個開發人員活動中明確了聲明。 Claude 2.1不再僅僅是研究資產。現在,它是一個用於企業級使用的結構化平台。借助圍繞安全性的成熟工具和透明的設計選擇,克勞德(Claude)可能成為評估生成AI選項的公司的首選選擇。
該模型的成功將取決於繼續共享數據,發布基準以及為真實用戶提供可衡量的價值。側重於長期擴張和開發者首先體驗,人類可能會成為企業AI中最重要的名字之一。