本周的3枚最大炸弹


加入我们的每日和每周信息选票,以获取人工智能领先的行业照明中的最新更新和独家内容。了解更多


篮球有一个疯狂的游行。 Tech有一个消费电子节目。 AI正在等待他的重要时刻 – 终于,本周可能是。

随着Microsoft Build和Google输入和输出的会议,这已经成为一个重要的一周。微软仅宣布了50种新的人工智能工具,Google每隔一天就继续自己的板岩。然后,从带有Claude 4的蓝色,拟人化的狗狗,这是其大型语言模型(LLM)的最后版本。

虽然广告的漩涡包含一些小饰品 – 丝毫(我们看着您,Google Virtual Try),但任何想与AI创建业务的人都必须找到很多期望,甚至可以立即使用一些新的工具。

您是否正在尝试跟上自己的一切可能?这是每家公司的最大广告,以及他们将在未来几个月内改变景观的方式。

微软希望AI代理商互相交谈

提供AI的能力,可以作为一个人进行工作,而不仅仅是说话,代理是LLMS的下一步。但是,有一个主要警告限制了它们:他们无法轻易相互互动。扔商店门票的AI经纪人,另一个人 – 酒店的书听起来不错,直到您在马德里的一间酒店房间降落在伦敦。

微软通过采用模型上下文的协议(MCP)来解决这种僵局,这是一种标准方法(即使是使用各种LLMS)进行通信的标准方法。拟人化实际上在2024年11月创建了标准。但是,Microsoft的采用意味着它正在成为对未来代理体系结构的改编,例如HTML为开放网络而言。 MCP还将微软还添加到Azure AI Foundry中,该工具是为创建人工智能应用程序的工具,因此用户可以开始建立立即相互交互的代理。

所以呢? AI代理仍处于起步阶段,但被广泛接受的标准将为下一代代理工具奠定道路。竞争对手之间的标准化意味着您将在自动化过程中选择垃圾,而不是在一家公司的生态系统中被阻止。

克劳德4使编码人员晕倒了

Chatgpt和Gemini经常掩盖Claude的3.3%的生成市场AI份额。尽管如此,开发人员将不想在Opus 4和Sonnet 4上睡觉,Sonnet 4突然在周四获得了一些严重的编码权。

克劳德4(Claude 4)也许是最令人印象深刻的马拉松比赛,直到以“扩展思维”模式进行七个小时,这使他能够采取数千个步骤并使用Web Puisk之类的工具。人类陈述还将研究更多的方法,捕获更多的错误并破坏其针对更复杂问题的推理。

通过这些改进,Claude Opus 4在流行的SWE Bench软件开发标准的顶部拍摄,占72.5%,这给了OpenAI O3(69.1%)和Gemini 2.5 Pro(63.2%)。

所以呢? 虽然测试并不总是说明整个故事,但克劳德(Claude)已经为开发人员选择LLM选择而赢得了声誉。 Claude 4通过改善软件社区的改善,进一步增强了声誉,这将有助于将其与他们的普通同行区分开。

Google在IO 2025上以大量的AI消费者AI首次亮相,从上述虚拟尝试到Google Beam,它将2D流动的流变成了生活,全息图,类似于使用六个不同角度的室内和大量AI的模型。然而,企业最间接的变化很可能是搜索的AI模式。

与AI评论一样,AI模式将双胞胎更加仔细地集成到搜索中。当您在人工智能模式下激活搜索时,Google会执行“抢劫请求的技术”,该搜索会破坏您对多次搜索的请求并同时执行它们,然后结合结果。虽然此模式以前可用于Google Labs用户,但本周它将成为主流。

所以呢? 即使您个人不使用人工智能模式,搜索Google的哪种变化也会向池塘发送涟漪,以供数百万企业依靠搜索Google吸引眼睛苹果的企业。 AI的审查转变为工业优化行业(SEO),AI模式可能会更加戏剧化。大多数人在Internet上找到信息的方式迅速变化。


Source link
Scroll to Top