DeepSeek V3-0324成为具有开源的AI的标志性成就,成为鲁ck模型的最高评级。
新车型在参考标准中提高了7分,以超越专有同事,例如Google Gemini 2.0 Pro,Sonnet antropic Claude 3.7和Meta的Llama 3.3 70B。
虽然V3-0324监视推理模型,包括其自己的R1 DeepSeek和OpenAI和Alibaba的报价,但成就强调了开源决策在对延迟敏感的应用程序中的生存能力日益增长,而直接答案至关重要。
DeepSeek V3-0324代表了AI开源的新时代
没有应用程序即时生成答案的模型,而无需咨询阶段的“思考”,对于实时使用,例如聊天机器人,客户服务自动化和实时翻译是必要的。现在,最新的DeepSeek迭代为这些应用程序奠定了标准,即使是领先的专有工具也黯然失色。

人工分析说:“这是开放权重的模型是没有替代的领先模型的第一次,这是开源代码的重要里程碑。”该模型的性能似乎更接近专有推理的模型,尽管后者仍然优于需要解决问题的任务。
DeepSeek V3-0324保留了其前任2024年12月的大多数规格,其中包括:
- 上下文窗口128K(通过API DeepSeek有限64K)
- 在需要超过700 GB的图形处理器内存的参数总量中,有6710亿个用于FP8精度
- 370亿个活动参数
- 仅适用于文本(没有多模式支持)
- 麻省理工学院许可证
“这仍然不像你可以在家跑步!”人工分析大喊大叫,强调了公司级别基础设施的要求。
带有开源的AI带来热量
诸如DeepSeek R1之类的专有推理模型在更广泛的智力中保持统治地位,但差距却缩小了。
三个月前,DeepSeek V3几乎与Anpropic和Google的专有模型相对应,但没有超过它们。如今,已更新的V3-0324不仅在开源代码中引导,而且超过了与上升无关的所有竞争对手。
“此版本可能比R1更令人印象深刻,”人工分析说。
DeepSeek进度标志着AI领域的转变,在该部门中,开源框架越来越多地与封闭的系统竞争。对于开发人员和企业,MIT许可的V3-0324提供了一个功能强大的,适用的工具,尽管其计算成本可以限制可用性。
人工分析说:“ DeepSeek目前正在管理未恢复的开放权重模型的边界。”
随着R2的到来,社区期望人工智能的另一项潜在跳跃。
(Paul Hanaoku的照片)
参见: 关于人工智能行动的拥抱呼吁开源代码

想进一步了解人工智能和行业领导者的大数据吗? 检查在阿姆斯特丹,加利福尼亚和伦敦举行的AI和大数据博览会。全面的活动以及其他领先活动,包括智力自动化会议,Blockx,一周的数字化转型和网络安全以及云博览会。
基于Techforge在此处探索企业技术和网络研讨会的其他事件。