DeepSeek最近的更新 DeepSeek-V3/R1推理系統 正在引起嗡嗡聲,但對於那些重視真正透明度的人來說,這一公告還有很多不足之處。儘管該公司展示了令人印象深刻的技術成就,但仔細觀察揭示了選擇性的披露和關鍵的遺漏,這使人們對真正的開源透明度的承諾受到質疑。
令人印象深刻的指標,不完整的披露
該版本強調了工程專長,例如高級跨節點專家並行性,與計算的溝通重疊,以及聲稱可以提供顯著吞吐量的生產統計數據 – 例如,每天提供數十億個代幣,每個H800 GPU節點每秒最多可處理73.7K代幣。這些數字聽起來令人印象深刻,並提出了一個高性能係統,以一絲不全地關注效率。但是,此類主張是沒有系統的完整,可再現的藍圖的。該公司已經提供了代碼的一部分,例如自定義的FP8矩陣庫和通信原語,但是關鍵組件(例如定制負載平衡算法和分解的內存系統)部分不透明。這種零散的披露將獨立驗證置於無法觸及的情況下,最終破壞了對提出的索賠的信心。
開源悖論
DeepSeek自豪地將自己作為開源先驅,但其實踐描繪了不同的圖片。儘管基礎架構和某些模型權重是在允許許可下共享的,但對於模型背後的數據和培訓程序,存在明顯的全面文檔。重要的細節(例如所使用的數據集,應用的過濾過程以及用於偏見的步驟)顯然缺失了。在一個越來越重視全面披露作為評估技術優點和道德考慮的手段的社區中,這種遺漏尤其有問題。沒有明確的數據出處,用戶將無法完全評估系統固有的潛在偏見或局限性。
此外,許可策略加深了懷疑主義。儘管提出了開源索賠,但該模型本身還是由具有異常限制的自定義許可證來限制,從而限制了其商業用途。這種選擇性的開放性 – 共享較少關鍵的部分,同時扣留核心組成部分 – 呼應一種稱為“開放洗淨”的趨勢,在該趨勢中,透明度的出現優先於實質性開放性。
缺乏行業標準
在一個透明度成為值得信賴的AI研究基石的時代,DeepSeek的方法似乎比開源社區的理想更反映了行業巨頭的實踐。儘管像Meta和Llama 2這樣的公司也因有限的數據透明度而面臨批評,但他們至少提供了全面的模型卡和有關道德護欄的詳細文檔。相比之下,DeepSeek選擇強調性能指標和技術創新,同時避開有關數據完整性和道德保障措施同樣重要的討論。
這種信息的選擇性共享不僅會使關鍵問題未解決,而且削弱了開放創新的整體敘述。真正的透明度不僅意味著揭示您的技術令人印象深刻的部分,而且還要就其局限性和仍然存在的挑戰進行誠實的對話。在這方面,DeepSeek的最新版本不足。
呼籲真正的透明度
對於愛好者和懷疑論者來說,開源創新的承諾應伴隨著全面的責任。 DeepSeek最近的更新在技術上很有趣,但似乎優先考慮對工程實力的拋光介紹,而不是更深入,更具挑戰性的真正開放性工作。透明度不僅是清單項目;它是AI社區信任和協作進步的基礎。
一個真正的開放項目將包括一組完整的文檔,從系統設計的複雜性到培訓數據背後的道德考慮。它將邀請獨立審查,並促進一個裸露成就和缺點的環境。在DeepSeek採取這些額外的步驟之前,它對開源領導的主張充其量只能得到部分證實。
總而言之,儘管DeepSeek的新推論系統很可能代表了技術的飛躍,但其透明度的方法表明了一個警示性的故事:令人印象深刻的數字和尖端技術並不能自動等同於真正的開放性。就目前而言,該公司的選擇性披露提醒您,在AI的世界中,真正的透明度與您遺漏的內容以及與您分享的內容一樣多。
Asif Razzaq是Marktechpost Media Inc.的首席執行官。作為一位有遠見的企業家和工程師,ASIF致力於利用人工智能的潛力來實現社會利益。他最近的努力是推出了人工智能媒體平台Marktechpost,該平台的深入覆蓋了機器學習和深度學習新聞,既在技術上都可以聽起來,既可以通過技術上的聲音,又可以被廣泛的受眾理解。該平台每月有超過200萬個觀點,說明了其在受眾中的受歡迎程度。
🚨推薦開源AI平台:“ Intellagent是一個開源的多代理框架,可評估複雜的對話AI系統”(已晉升)