憑藉其可愛的鯨魚徽標,DeepSeek最近的發布本來可以構成另一個Chatgpt仿製。使它如此具有新聞價值的原因 – 以及將競爭對手的股票送入了尾巴的原因 – 創造成本很少。它有效地將猴子扳手投入了美國對訓練高功能大語言模型(LLM)所需的投資觀念。
DeepSeek據稱僅花費600萬美元來培訓其AI模型。並列於據報導,Openai在聊天GPT-4上花費了80-1億美元,或者他們為GPT-5預留了10億美元。 DeepSeek稱投資水平質疑,並使Nvidia這樣的大型參與者在一天內的股票價值下降了6000億美元 – TSMC和Microsoft對AI的長期財務生存能力感到滿意。如果可以訓練AI模型的明顯少於以前的假設,那麼這對AI總體支出的預定了什麼?
儘管DeepSeek的中斷導致了重要的討論,但一些關鍵點似乎在洗牌中迷失了方向。但是,新聞所引起的更大關注的重點是AI的創新成本和可能的經濟影響。以下是來自此消息的三個重要見解:
1。DeepSeek的600萬美元價格誤導了
公司需要掌握其基礎設施的總擁有成本(TCO)。儘管DeepSeek的600萬美元價格已售罄,但這可能只是其培訓前運行而不是整個投資的成本。總成本(不僅是跑步,而且要建築物訓練深索)的總成本可能要高得多。行業分析師公司的半分析表明,DeepSeek背後的公司花費了16億美元在硬件上,以使其LLM成為現實。因此,可能的成本在中間。
無論是真正的成本,DeepSeek的出現都將重點放在可能具有變革性的成本效益創新上。創新通常受到限制的刺激,而DeepSeek的成功強調了當工程團隊在面對現實世界限制時優化其資源時創新的方式。
2。推論是使AI有價值的,而不是培訓的原因
重要的是要注意多少AI模型培訓成本,但是培訓代表了建立和運行AI模型的總成本的一小部分。 推理 – AI改變人們的工作,互動和生活的方式是AI真正有價值的地方。
這提出了傑文派悖論,這是一種經濟理論,表明,隨著技術的進步使資源的使用更加有效,該資源的總體消費實際上可能會增加。換句話說,隨著培訓成本的下降,推理和代理消費將增加,總體支出將效仿。
實際上,AI效率可能會導致AI支出的上升,這應該提升所有船隻,而不僅僅是中國船隻。假設他們乘坐效率波,Openai和Nvidia等公司也將受益。
3。仍然如此的是,單位經濟學最重要
提高AI的效率不僅是降低成本;這也是關於優化單位經濟學的。 Motley傻瓜預測今年將是AI效率的一年。如果合適,公司應注意降低其AI培訓成本以及AI消費成本。
建立或使用人工智能的組織需要了解其單位經濟學,而不是挑出令人印象深刻的人物,例如DeepSeek的600萬美元培訓成本。真正的效率需要分配所有成本,跟踪AI驅動的需求,並在成本到價值上保持不斷的標籤。
雲單位經濟學(CUE)與測量和最大化雲驅動的利潤有關。 CUE將您的云成本與收入和需求指標進行比較,揭示了您的雲支出的效率,隨著時間的變化如何變化,以及(如果您擁有正確的平台)提高效率的最佳方法。
鑑於與超級標准出售的傳統雲服務本質上更昂貴,因此了解提示在AI環境中的實用性更大。構建代理應用程序的公司可以計算其每筆交易的成本(例如每張賬單成本,每筆交付成本,每次交易成本等),並使用它來評估特定AI驅動的服務,產品和功能的投資回報率。隨著AI支出的增加,公司將被迫這樣做。沒有公司可以永遠在實驗創新上付出無盡的美元。最終,必須具有商業意義。
提高效率
多麼有意義的600萬美元的數字是,DeepSeek可能提供了一個分水嶺,使科技行業醒來,不可避免地要效率。希望這能為漏洞的培訓,推斷和代理應用開放,以釋放AI的真正潛力和ROI。