Anpropic介绍了其最后一个Claude 4模型系列,对于所有建造下一代或编码的人来说,它看起来就像是一个跳跃。新的Powerhouse和Claude Sonnet 4的演出唱片《 Opus 4》的明星,旨在是聪明的通用。
拟人化对其野心并不害羞,声称这些模型旨在“促进客户AI的策略在各个方向上”。他们将Opus 4定位为工具“将界限放在编码,研究,字母和科学发现中”,而SONNET 4被宣布为“使用SONNET 3.7的即时更新”,随时准备将“边界指标纳入日常使用示例”。
Claude Opus 4:新的编码冠军
当无水分子用他的“最强大的模型和世界上最好的编码模型”称为Claude Opus 4时,您坐下来注意。而且,他们的数字可以支持Opus 4,由重要行业测试的图表领导,在SWE板凳上达到72.5%,终端为43.2%。
但这不仅与快速冲刺有关。 Opus 4长期以来旨在“在需要集中精力和成千上万步骤的长期任务上可持续绩效”。 II,可以“连续工作几个小时”,这是Anthropus声称的。
与以前的十四行诗的模型相比,这应该是一个巨大的进步,并且可以扩大人工智能代理可以实现的目标,从而解决需要真正毅力的问题。
克劳德十四行诗4:对于每日AI和代理商工作
尽管Opus 4是重量级冠军,但Claude Sonnet 4构成了普遍的主力军,并有望在大量应用中大大增加。那些外观广泛的人的早期评论都在发光。
例如,Github“说克劳德·索内特(Claude Sonnet)4在代理场景中飞来飞去”,并给人留下了深刻的印象,以至于“他们计划将其作为Github Copilot新编码代理的基本模型展示。”这是一个巨大的认可。
MANUS技术评论员还强调“在以下复杂说明,清晰的推理和美学退出中的改进”印象深刻。
积极的振动继续以“报告十四行诗4的报道,在应用程序的自动多功能开发中取得了成功,并且也显着改善了有关代码基本 – 露骨导航错误的解决方案和导航的解决方案,从20%到零”。这是开发工作过程中游戏的变化。
SourceGraph同样乐观,认为该模型是“软件开发的重大飞跃 – 在途中更长的时间,对问题的更深入了解并提供更优雅的质量代码。”
加法代码显示了“更高的成功指标,更多的手术代码和更彻底的工作”,这迫使他们以“主要模型的主要选择”制作十四行诗4。
杂种和愉悦开发商
关于Claude 4家族的真正聪明的作品之一是其混合人物。 Opus 4和Sonnet 4都可以在两个程序中使用:一个是我们经常需要的几乎即时答案,另一个可以“扩展思维以更深入的推理”。
这种更深入的思维制度是Pro,Max,Team和Enterprise Claude计划的一部分。对于每个人来说,这是个好消息,至少有这种高级思维的sonnet 4也将为免费用户提供,这是使最高水平更实惠的AI的绝妙步骤。
Anpropic还为开发人员开发了几种美味的工具,显然旨在使更复杂的AI代理的创建超负荷:
- 代码执行工具:这允许模型实际运行代码,为交互式和决定性应用程序打开各种机会。
- Connector MCP:由Anpropic,MCP Standardse上下文交换在人工智能助理和软件环境之间提出。
- API文件:这将极大地促进AI直接与文件合作,这对于许多实际任务非常重要。
- 反向缓存:开发人员将能够在一个小时内缓存提示。这听起来很少,但这对于速度和效率来说可能是真正的价值,尤其是对于经常使用的请求。
现实世界中的领导包
Anpropic试图强调“ Claude 4模型导致SWE Bench验证,这是执行实际软件开发任务的标准。”除了编码外,他们还强调,这些模型“在编码,推理,多模式功能和代理任务方面提供了强大的性能”。

尽管能力有所增加,但人类仍以价格保持界限。 Claude Opus 4将花费100万个输入令牌和每百万个令牌75美元的费用。 Claude Sonnet 4,一种更实惠的选择,价格为每百万个输入令牌3美元,一百万个令牌的价格为15美元。此序列将欢迎现有用户。
Claude Opus 4和Sonnet 4都准备通过人类API,并且还出现在Amazon Bedrock和Google Cloud Cloud Vertex AI上。这种广泛的可用性意味着世界各地的企业和开发人员可以很容易地开始实验和整合这些新工具。
人类显然会加倍,这使AI更有能力,尤其是在代理的编码和自主行为的复杂领域。借助这些新模型和开发人员工具,创新的潜力刚刚得到了严重的冲动。
(提供的图像:ANTROP)
参见: 雄心勃勃的设备Openai Johni Ive泄漏的详细信息

想进一步了解人工智能和行业领导者的大数据吗? 检查在阿姆斯特丹,加利福尼亚和伦敦举行的AI和大数据博览会。全面的活动以及其他领先活动,包括智力自动化会议,Blockx,一周的数字化转型和网络安全以及云博览会。
基于Techforge在此处探索企业技术和网络研讨会的其他事件。