OpenAI为开发人员启动前查看Codex AI SWE


加入我们的每日和每周信息选票,以获取人工智能领先的行业照明中的最新更新和独家内容。了解更多


奇妙!在有报道称Openai被White编码Windsurf的初创公司购买后仅几天后,这家前公司显然推出了自己的竞争对手的服务,作为该研究以其法典品牌对研究的初步观看,他遇到了Cursor,Cursor,以及越来越多的初创公司和初创公司提供的AI编码工具清单。大型技术公司,包括微软和亚马逊。

与以前的AI代码代码OpenAI模型不同,新版本是用于开发AI(SWE)软件的完整云代理,该代理是在O3 Operai推理模型的精细调整上创建的,该模型可以并行执行多个开发任务。

从今天开始,在不久的将来,它将在PLUS和EDU用户的支持下为Chatgpt Pro,Enterprise和Team用户提供。

法典演变:从模型到自主编码代理AI

这个问题标志着代码制定的重要一步。原始法典于2021年首次亮相,是通过OpenAI应用程序编程的新兴界面将自然语言转换为可用代码的模型。

这是站在Github Copilot后面的引擎,Github Copilot是一名流行的编码助手,该助手是为IDE设计的自动填充风格,例如Visual Studio Code。

这种初始迭代的重点是在公共源代码数十亿行中培训的代码的生成和完成。

但是,早期版本有限制。它遭受句法错误,不安全的代码句子以及其训练数据中内置的位移。该代码有时提出了一个表面正确的代码,该代码无法在功能上执行,在某些情况下,基于提示使有问题的关联。

尽管存在这些缺点,但这表明了足够的前景来建立AI的编码工具作为快速增长的产品类别。根据OpenAI的代表,该原始型号已安装,并将其变成了一套新产品的名称。

Github Copilot于2023年3月从Codex OpenAI模型正式越过,他接受了GPT-4作为其Copilot X Update的一部分,以确保更深入的IDE集成,聊天功能和更广泛的上下文句子。

代理愿景

新代码远远超出了其前身。现在,Codex是为了自主管理的时间,Codex可以编写功能,正确的错误,回答特定于基础的问题,开始测试并提供吸引的请求,可以在安全的隔离云沙盒中执行任务。

该设计反映了更广泛的Openai野心,超越了快速答案和协作。

乔什·托宾(Josh Tobin)领导Openai的研究小组的乔什·托宾(Josh Tobin)在最近的一份简报中说:“我们将代理人视为可以代表您的AI系统,可以在更长的时间内进行大型工作,与现实世界互动。”该代码直接符合此定义。他补充说:“我们的愿景是,Chatgpt几乎会像一个虚拟同事一样,而不仅仅是回答快速问题,而是在许多任务上合作。”

OpenAI发布的数字显示,新的SWE Codex-1代理在SWE的内部任务中优于OpenAI推理的所有最新模型。

新机会,新界面,新的工作流程

Codex任务是通过Chatgpt中的侧面面板接口启动的,该侧面界面允许用户请求具有任务或问题的代理。

代理在带有用户商店的空气环境中处理每个请求,并为镜像调整了开发设置。他记录了自己的行动,指测试输出并总结变化,创建他的作品,追踪和修订。

OpenAI桌面和代理商团队负责人亚历山大·恩伯里科斯(Alexander Embiricos)(以及前总监兼CO -FOUNGER -SCRENSHARE COMPALITORATION Startup Multi -Multi(去年)以未探索的金额收购)在与记者简报上说,Codex Agent Is codex是Codex。用于软件开发的云代理,可以使用自己的计算机在许多段落上工作,以安全和独立。透明

据他说,在内部,工程师已经在使用它“作为案件的早晨清单,将任务关闭到代码,然后返回准备查看或合并的一批草稿决定。”

Codex还通过代理支持配置。在项目级别上的MD繁殖文件,该文件教代理如何在代码库中导航,启动特定的测试并监视编码房屋的样式。

Embiricos说:“我们教我们的模型阅读代码并显示样式 – 例如,使用或不使用牛津逗号 – 因为代码样式具有正确的正确性。”

安全与实际用途

Codex执行任务,无需访问Internet,仅绘制用户提供的代码和依赖性。该设计提供了安全的操作,并最大程度地减少了潜在的不当使用。

“这不仅仅是模型API,” Embiricos说。 “由于它在人类审查的空气环境中起作用,因此我们可以安全地提供更大自由的模型。”

Openai还报告了尽早使用。思科评估法典以加速其产品中的工程。临时使用它来执行背景任务,例如调试和写作测试。超人使用法典来改善测试涂层,并允许工程师提供简单的代码更改。自动运输公司Kodiak使用它来提高代码的可靠性,并了解不熟悉的堆栈组件。

Openai还将更新在他的本地开发的光终端代理Codex CLI中部署。现在,CLI使用较小的模型Minino-Salad优化,以低延迟和问题和答案进行编辑。

价格为100万个输入令牌的价格为1.50美元,百万个令牌为6美元,缓存折扣为75%。目前可以在部署期间使用法典,并按需对价格和定价选项有计划的限制。

这是否意味着Openai不购买风潮? *表情符号的心理面孔*

Codex发行是在人工智能编码工具的竞争增加的背景下发生的 – 以及Openai打算创建而不是购买的信号,即其下一阶段的产品。

根据最近的数据,在过去的12周内,来自类似的WHEB的开发人员的流量增长了75%,强调了对编码助手的需求不断增长,这是重要的基础设施,而不是实验性的增加。

TechCrunch和Bloomberg的报告表明,OpenAI与AI Dev Crevor和Windsurf工具的快速成长初创公司进行了谈判。据称,光标离开了桌子。据报道,Windsurf同意以30亿美元的价格购买Openai,尽管OpenAI或Windsurf尚未正式确认。

实际上,在昨天,Windsurf以自己的基础家庭为基础,以编码为导向SWE-1,该swe-1专门设计,旨在支持从调试到长期项目服务的充分寿命软件开发周期。 SWE-1模型是为了订购的,使用了针对真实工作流程的新的顺序数据模型进行订单,完全由自己培训。

许多事情可能发生在两家公司之间的幕后,但是对我而言,Windsurf迄今为止启动了自己的战略编码模型,迄今为止,使用Llama选项,并为用户提供了在不久的将来不一致的OpenAI和Anthropic Models-Day在OpenAI和Anthropic Models-Day的机会。

但是,另一方面,这个新的SWE Codex AI代理在“研究初步观看”开始的事实可以成为风力冲浪或光标或其他人来到餐桌上并达成协议的压力形式。 Openai的代表回答了有关获取风力冲浪的潜力以及其中一位的报告的问题,告诉VentureBeat,他们在这方面没有什么可分享的。

无论如何,Embiricos将法典作为简单的代码工具或助手创建。

他说:“我们将在开发人员与代理商合作的方式上发生地震转变 – 不仅是实时与他们结合,而且还完全委派了任务。” “第一个实验仅仅是为了使模型访问终端。经验是神奇的 – 他们开始为我们做些事情。”

为开发人员团队而建造,而不仅仅是独奏开发人员

考虑到专业开发人员,Codex是开发的,但是Embiricos指出,即使产品上的产品也发现它在绘制人类SWE之前在提供或检查更改也很有用。这种多功能性反映了开放式策略,以创建提高技术团队性能的工具。

该项目的工程领导者特里尼(Trini)总结了代理人后面的更广泛的野心:“这是软件工程师与AI和计算机互动的变革性变化。他增强了每个人的潜力。”

OpenAi代表新工作流的中心元素代表Codex,工程师为代理分配高级任务并与它们合作不同步。该公司通过GitHub,catgpt桌面,跟踪器和CI系统创建更深入的集成。长期目标是将交配实时结合,并将任务的代表团与长期的唱片合成为无缝的发展经验。

正如乔什·托宾(Josh Tobin)所说:“编码是整个经济中许多有用的事情的基础。编码加速度是分配AI对人类(包括本身)的优势的特别高的方法。”

不管竞争对手的OpenAI交易是否正在关闭,该信息都很明确:Codex在这里,Openai依靠其代理人领导开发人员生产力的下一章。


Source link
Scroll to Top