揭幕Manus AI:中國在完全自主的AI代理商中的突破

就像塵埃開始落在DeepSeek上時,中國初創公司的另一個突破席捲了互聯網。這次,這不是一種生成的AI模型,而是由中國公司Monica於2025年3月6日推出的完全自主的AI代理Manus。與Chatgpt和DeepSeek(例如Chatgpt和DeepSeek)不同,它只是對提示的響應,Manus旨在獨立工作,做出決策,執行任務並與最少的人類參與產生決策。這種發展標誌著AI發展的範式轉變,從反應性模型轉變為完全自主的代理。本文探討了Manus AI的架構,其優勢和局限性及其對自主AI系統未來的潛在影響。

探索Manus AI:一種自主代理的混合方法

“ manus”這個名字來自拉丁語短語 Mens等人 這意味著思想和手。該命名法完美地描述了Manus思考(處理複雜信息並做出決定)和ACT(執行任務並生成結果)的雙重能力。為了思考,Manus依靠大型語言模型(LLM),並且為了採取行動,它將LLM與傳統的自動化工具集成在一起。

MANUS遵循一種神經符號的方法,用於執行任務。在這種方法中,它採用了LLM,包括擬人化的Claude 3.5十四行詩和阿里巴巴的Qwen來解釋自然語言提示並製定可行的計劃。 LLMS具有用於數據處理和系統操作的確定性腳本增強。例如,儘管LLM可能會起草Python代碼來分析數據集,但MANUS的後端在受控環境中執行代碼,驗證輸出並在出現錯誤時調整參數。該混合模型可以平衡生成AI的創造力和編程工作流的可靠性,從而使其能夠執行複雜的任務,例如部署Web應用程序或自動化跨平台交互。

Manus AI的核心是通過模擬人類決策過程的結構化代理循環運行。授予任務後,它首先分析識別目標和約束的請求。接下來,它從其工具包中選擇工具(例如Web刮刀,數據處理器或代碼解釋器),並在安全的Linux沙盒環境中執行命令。該沙箱使MANUS可以安裝軟件,操縱文件並與Web應用程序進行交互,同時又可以防止未經授權訪問外部系統。每次動作後,AI評估結果,迭代其方法,並完善結果,直到任務符合預定義的成功標準為止。

代理體系結構和環境

馬努斯的關鍵特徵之一是其多代理體系結構。該體系結構主要依賴於負責管理各種專業子代理的中心“執行者”代理。這些子代理能夠處理特定的任務,例如Web瀏覽,數據分析甚至編碼,這使MANUS可以解決多步問題,而無需其他人類干預。此外,Manus在基於雲的異步環境中運行。用戶知道代理商將繼續在後台工作,並在完成後發送結果,可以將任務分配給MANUS,然後脫離接觸。

性能和基準測試

Manus AI已經在行業標準的績效測試中取得了巨大成功。它顯示了Gaia基準測試的最新結果,該測試是由Meta AI創建的,擁抱面和AutoGPT來評估代理AI系統的性能。該基準測試評估了AI邏輯推理,處理多模式數據並使用外部工具執行現實世界任務的能力。 Manus AI在此測試中的表現使其領先於OpenAI的GPT-4和Google的模型等知名玩家,並將其確立為當今最先進的General AI代理之一。

用例

為了展示Manus AI的實際功能,開發人員在發布過程中展示了一系列令人印象深刻的用例。在一個情況下,要求Manus AI處理招聘過程。當獲得簡歷的集合時,Manus不僅僅是按關鍵字或資格進行分類。通過分析每個簡歷,與就業市場趨勢的交叉引用技能,並最終向用戶提供詳細的招聘報告和優化的決定,這進一步發展。 Manus完成了這項任務,而無需其他人類的投入或監督。此案例顯示了其自動處理複雜工作流程的能力。

同樣,當被要求生成個性化的旅行行程時,Manus不僅考慮了用戶的偏好,還考慮了外部因素,例如天氣模式,當地犯罪統計和租賃趨勢。這超出了簡單的數據檢索,並且反映了對用戶未闡明的需求的更深入的了解,這說明了Manus執行獨立的,上下文感知的任務的能力。

在另一場演示中,馬努斯(Manus)的任務是撰寫傳記並為科技作家創建個人網站。在幾分鐘之內,馬努斯(Manus)刮擦了社交媒體數據,創建了一部綜合傳記,設計了網站並將其現場部署。它甚至自動固定了託管問題。

在金融領域,馬努斯(Manus)的任務是對NVDA(NVIDIA),MRVL(Marvell Technology)和TSM(台灣半導體製造公司)的股票價格進行相關性分析。 MANUS首先從Yahoofinance API中收集相關數據。然後,它會自動編寫必要的代碼來分析和可視化股票價格數據。之後,Manus創建了一個網站來顯示分析和可視化,生成了可共享的鏈接以便於訪問。

挑戰和道德考慮

儘管有非凡的用例,但Manus AI還是面臨一些技術和道德挑戰。早期採用者報告了該系統進入“循環”的問題,該系統反复執行無效的行動,需要人為乾預才能重置任務。這些故障突出了開發可以始終如一地導航非結構化環境的AI的挑戰。

此外,儘管Manus出於安全目的在孤立的沙箱中運行,但其Web自動化功能引起了人們對潛在濫用的擔憂,例如刮擦受保護的數據或操縱在線平台。

透明度是另一個關鍵問題。 Manus的開發人員強調了成功的故事,但是對其功能的獨立驗證是有限的。例如,雖然其演示儀表板生成的運行順利,但用戶在將AI應用於新的或複雜的方案時觀察到了不一致的情況。缺乏透明度使建立信任變得困難,尤其是當企業考慮將敏感任務委派給自治系統時。此外,缺乏評估AI代理的“自主權”的明確指標為Manus是否代表真正的進步還是僅僅是複雜的營銷給予了懷疑的空間。

底線

MANUS AI代表了人工智能的下一個前沿:能夠獨立或沒有人類監督的各種行業執行任務的自主代理。它的出現標誌著AI所做的不僅僅是協助的新時代的開始,它是一個完全集成的系統,能夠從頭到尾處理複雜的工作流程。

儘管它仍在Manus AI的發展中,但潛在的影響很明顯。隨著像Manus這樣的AI系統變得越來越複雜,他們可以重新定義行業,重塑勞動力市場,甚至挑戰我們對工作意義的理解。 AI的未來不再僅限於被動助手,而是關於創建自己思考,行動和學習的系統。馬努斯只是開始。

Source link

You might also enjoy

Subscribe Our Newsletter

Scroll to Top