使用浏览器的代理的增长:为什么代理服务器会融合OpenAI操作员


加入我们的每日和每周信息选票,以获取人工智能领先的行业照明中的最新更新和独家内容。了解更多


出现了将浏览器与AI一起使用的新浪潮,有望改变企业与Internet互动的方式。这些代理商可以自主关注网站,接收信息甚至完成交易,但是早期测试揭示了承诺与绩效之间的巨大差距。

虽然代理商新运营商为使用OpenAI浏览器提供的消费者示例,例如,订购比萨饼或购买游戏票的门票,落入报纸标题,这是使用开发人员和企业的主要选择所在的问题。 “我们不知道的是杀手级应用程序,” Red Dragon的联合创始人Sam Wittivin说,这是一家为AI代理商开发应用程序的公司。 “我认为这些将是您真正不喜欢的互联网上只需花费时间的事情。”这包括诸如访问互联网以及找到产品最便宜的价格或在酒店预订最佳住房之类的东西。最有可能将其与其他工具(例如深度研究)结合使用,公司可以进行更复杂的研究 在互联网周围执行任务。

公司应仔细评估快速发展的景观,因为著名的玩家和初创企业使用不同的方法来解决自主观看问题。

代理商景观中的主要参与者使用浏览器

大型技术公司和创新的初创公司都很快变得拥挤:

从准备消费者和准备就绪的角度来看,操作员和代理是最先进的。许多其他人似乎将自己定位在开发人员或企业中。例如,使用浏览器,启动Y-Component,该Y组件允许用户配置与代理使用的模型。这使您可以更多地控制代理的工作原理,包括使用本地计算机的模型。但这绝对是更多参与。

上面列出的其他人提供了不同程度的功能和与本地机器资源的交互。我决定目前不测试Bontedance用户界面,因为它要求访问较低级别的机器安全性和机密性(如果检查它,我肯定会使用二级计算机)。

测试揭示了推理的问题

因此,最简单的测试是OpenAI操作员和代理服务器。在我们的测试中,结果强调了推理的可能性如何具有比未经处理的自动化功能更多的值。尤其是操作员更有光芒。

例如,我要求代理商查找和总结五个最受欢迎的VentureBeat故事。这是一项模棱两可的任务,因为VentureBeat没有“最受欢迎的”部分 像这样操作员用一个领域进行了战斗。起初,他陷入了无尽的滚动周期,并寻找需要手动干预的“最受欢迎的”故事。在另一次尝试中,他发现了三年的文章,题为“本周五个最佳故事”。相反,代理证明了最好的推理,确定主页上最明显的故事是对受欢迎程度的实际代理,这提供了准确的简历。

在实际任务中,这种差异变得更加清晰。我要求代理商在加利福尼亚州纳帕市中午的一家浪漫餐厅预订预订。操作员线性地接近任务 – 首先是寻找浪漫餐厅,然后检查中午的可用性。当没有桌子时,它到达了一个死胡同。该代理表现出更为复杂的推理,首先要在所需的时间找到浪漫且负担得起的餐厅。它甚至以较高的评分返回。

即使,似乎简单的任务也揭示了重要的差异。在搜索“价格NFC Yubikey 5C NFC”时,代理很快发现该项目比操作员容易。

Openai并没有用他使用操作员来教他的经纪人的许多技术,只是说他教他的模型来使用浏览器的任务。但是,这种融合提供了更详细的信息:其代理使用一种称为生成树的搜索来“使用在提出的操作后预测互联网的Web-World模型。它们是递归生成的,用于创建可能未来的树,该树希望选择以下最佳动作,这是由我们的成本模型评估的。我们的网络世界模型也可用于在假设情况下教代理商,而无需产生许多昂贵的数据。 (在此处阅读更多)。

目前测试可能无用

在纸上,这些工具看起来很接近。 WebVoyager标准的代理服务器收敛量达到88%,该标准评估了15个流行网站(例如Amazon和Booking.com)上643个真实任务的Web代理。 OpenAI操作员获得了87%的速度,而浏览器 – 使用说它达到了89%,但只有在WebVoyager代码基础发生短暂变化之后,他就认识到“根据我们的需求”。

这些控制指标应该真正使用盐谷物,因为它们可以是游戏。该测试是用于实际情况的实际用途。现在很早,空间变化如此之快,这些产品几乎每天都在变化。结果将更多地取决于您要完成的特定任务,而您可以依靠使用各种产品时收到的振动。

企业后果

企业自动化的后果很大。正如Wittein在与播客的对话中指出的那样,在浏览器使用浏览器时,我们深深沉浸在这种趋势中,许多公司目前正在为由Real People控制的虚拟助手付费,以应对主要的Web研究和数据收集任务。这些使用浏览器的试剂可以极大地更改此方程。

维特因说:“如果AI接受它,这将是失业的最早的低水果之一。这将出现在其中的一些事情中。”

这可能是在自动化机器人过程(RPA)的趋势上,其中使用浏览器用作公司自动化更多任务的另一种工具。而且,如前所述,更强大的使用情况将是当代理将浏览器与其他工具相结合时,包括诸如深度研究之类的东西,其中LLM管理的代理使用搜索工具 浏览器用来执行更复杂的作业。

刺激创新的成本动态

有助于快速发展的另一个关键因素是开源讨论的强大模型,例如DeepSeek-R1。这样一来,使用浏览器创建这些代理的公司就可以使用这些模型有效地与较大的玩家竞争,而不是创建自己的模型。

价格压力已经很明显。虽然OpenAI需要每月一次的Chatgpt Pro订阅为200美元,但融合提供有限的免费用途(每天最多使用5次使用)和每月20美元的无限计划。这种竞争动力应该加速企业的采用,尽管显而易见的使用选项仍在出现。

安全与整合问题

在企业的广泛传播之前,仍然存在几个障碍。一些网站会积极阻止自动查看,而另一些网站则需要验证码。虽然OpenAI和Contergence具有可以克服CAPTCHA的工具,但它们允许用户承担任务以填充它们 – 而不是直接使它们直接制作,因为Captcha的全部要点是确保该人在另一端。 Deep System Access请求诸如Bytedance用户界面之类的工具,这会导致企业部署的安全问题。

此外,与网站合作的方法也有所不同。 OpenAI与特定合作伙伴(例如Instacart,Priceline,Doordash和Etsy)合作,而其他人则试图浏览任何网络摄像头。这种差异会影响公司使用选项的可靠性。而且,当然,每当代理商到达网站时,需要放慢速度的入口详细信息 – 因为代理商会给您一切以填写这些详细信息。

展望未来

对于评估这些工具的企业,当自主的Web集成可以确保具有清晰的价值时,无论是在研究,客户服务还是过程自动化时,都应将主要注意力集中在特定的使用方案上。该技术迅速发展,但成功将取决于特定业务需求的机会的对应关系。

随着该空间的发展,期望更多针对特定行业或任务的企业和潜在专业的代理商的功能。著名玩家与创新初创公司之间的竞赛应该刺激技术进步和竞争价格,这使2025年成为采用企业使用代理商的重要一年。

要获取有关这些趋势和测试结果的更多信息,请阅读Sam Wittevin和我之间的完整视频对话。


Source link
Scroll to Top