Mistral AI启动了Devstral,这是一种功能强大的新代理代理模型,其开源代码可用于笔记本电脑


加入我们的每日和每周信息选票,以获取人工智能领先的行业照明中的最新更新和独家内容。了解更多


一家资金丰富的法国AI Mistral模型制作人从2023年秋天首次亮相他自己强大的开源代码模型以来就一直刺穿了自己的体重,但最近他要求进行一些批评,X上的开发人员最近成为了他自己的大型语言模型(LLM)的最后发行,这被称为“媒介3”,这是他们被称为“媒体”的典范,这是他们的开放式型号。

(回想一下,必须付费,而必须支付专利模型,并且其设置参数更加有限,并且由模型制造商控制。)

但是今天,米斯特拉尔(Mistral)返回并返回带有开源的AI社区,尤其是使用AI的软件开发。该公司与开源All Hands AI联合使用Devstral的开放式Devin的创建者,这是一种新的语言模型,该模型具有开源代码,其参数比许多竞争对手少于许多竞争对手,其模型,因此需要更小的计算能力,因此可以在代理商开发的专门构建的代理机构中启动它。

与传统的LLM不同,旨在完成代码的简短形式或生成孤立的功能,Devstral被优化,可以作为开发软件开发的完整代理,这些软件可以理解不同文件中的上下文,在大型代码基础上导航并解决现实世界的问题。

当前,该模型可在允许的Apache 2.0许可证上自由使用,该许可证允许开发人员和组织在不限制的情况下部署,更改和商业化。

Mistral AI的研究员Rosier说:“我们想向爱好者的开发人员和社区释放一些东西 – 他们可以在地方一级的私下工作,并根据他们想要的改变这一事实。” “它是在Apache 2.0下发布的,因此人们可以用他们想要的一切来做到这一点。”

基于Codestral

Devstral是Mistral不断增长的投资组合的下一步,重点是代码,此前其在Codestral系列中的早期成功之后。

CodeStal首次在2024年5月推出,是专门编码LLM的Mistral的最初Naber。它是220亿个参数的型号,接受了处理80多种编程语言的培训,并因其在代码生成和完成任务中的有效性而受到尊重。

该模型的受欢迎程度和技术力量导致了快速迭代,包括在Mamba的架构上启动Codestral-Mamba-Mamba版本,以及最近的Codestral 25.01,该版本发现了引入IDE插件的引入和正在寻找具有低含量含量的高频模型的IDE插件。

围绕Codestral的冲动有助于将Mistral确立为编码模型生态系统中的关键参与者,并为开发Devstral-with-with-with完成工作奠定了基础,直到任务完全完成为止。

在SWE基准的顶部超过了较大的型号

Devstral的SWE-Bench估算为46.8%,SWE Bench是来自500个实际GitHub问题的一组数据,并为正确的数据提供了手动确认。

这使其领先于所有先前发布的带有开源的型号,并领先于几个封闭型号,包括GPT-4.1-Mini,它超过20个百分点。

Rozer说:“目前,这是检查SWE板凳和代码代理的最佳开放模型。” “这也是一个非常小的模型 – 只有240亿个参数 – 您甚至可以在MacBook上工作。”

“将Devstral与在任何框架下评估的封闭和开放模型进行比较,我们发现Devstral的性能要比具有封闭源的许多替代方案要好得多,” Mistral AI的开发人员负责人索非亚·杨(Sofia Yang)写道,与社交网络X相比。

该模型是使用Mistral Small 3.1使用安全性和对准安全的方法创建的。

Rozer说:“我们从一个非常好的基本模型开始,对Mistral Trees的控制很少,这已经运行良好。” “然后,我们使用安全性和加强方法对其进行专门研究,以提高其在SWE板凳上的性能。”

为代理时代建造

Devstral不仅是代码生成的代码模型,因此可以优化用于集成到OpenHands,Swe-Agent和Opendevin等代理框架中。

这些帧允许Devstral与测试用例进行交互,导航源文件并在不同项目中执行多阶段任务。

Rozer说:“我们将其与Opendevin一起释放,这是代码代理商的森林。” “我们正在建立一个模型,它们创造了森林 – 该模型可以使用的一组技巧和工具,例如开发人员模型的BAC。”

为了确保可靠性,该模型在不同的存储库和内部工作过程中进行了测试。

罗泽解释说:“我们非常小心,不要充满SWE板凳。” “我们只教了从SWE板台上克隆的存储库中的数据,并在不同的结构中检查了模型。”

他补充说,Devstral Mistral Devstral在内部提供它,以使其概括为新的,无形的任务。

有效的开放许可证有效部署 – 即使对于企业和商业项目

Devstral 24b的紧凑型体系结构对于本地开发人员来说是实用的,无论是在一个图形处理器RTX 4090上还是带有32 GB RAM的Mac。这使他对使用和部署优势的机密性很有吸引力。

Rozier说:“该模型针对的是发烧友和关心私下事物的人 – 即使没有互联网,他们即使在飞机上可以使用的东西。”

除了性能和容忍度外,其Apache 2.0许可证还为商业应用提供了令人信服的优惠。该许可解决无限使用,适应和分配,即使是为了采用企业的专有产品创造,低相位选择的产品。

详细的规格和使用说明可在Devstral-Small-2505模型地图上提供,用于拥抱面孔。

该型号的令牌上下文窗口为128,000,并使用Tekken令牌和131,000词汇。

它通过所有主要的开源平台来支持部署,包括拥抱面孔,Ollama,Kaggle,LM Studio和Unsploth,并与VLLM,Transformers和Misstral的撤回等库一起工作。

通过API或本地级别可用

Devstral可通过API API Platforme API Appi Applecke应用程序获得,以Devstral-Small-2505型号的名义获得,此外,定价为每百万个输入令牌0.10美元,每百万美元。

对于那些在本地展开的人,诸如OpenHands之类的框架的支持允许与框中的代码库和代理工作过程集成。

Rosieri分享了他如何在自己的开发流中包含Devstral:“我自己使用它。您可以要求他执行小任务,例如,更新软件包的版本或更改令牌化场景。他在代码中找到了正确的位置并进行了更改,并进行了更改。非常好的使用。”

进一步

尽管Devstral目前是作为研究初步观看而生产的,但Mistral和All Hand Al Hand AI已经在使用高级功能的更大后续模型上工作。罗泽说:“较小的模型和较大的模型总是会有差距,但是我们已经为克服它而努力了。这些模型已经非常努力地工作,即使与一些较大的竞争对手相比。”

由于其性能指标,许可证和代理设计,Devstral的位置本身不仅是代码生成工具,而且是创建自动软件开发系统的基本模型。


Source link
Scroll to Top