Openai将GPT-4.1和4.1 Mini带到Chatgpt,企业应该知道的


加入我们的每日和每周信息选票,以获取人工智能领先的行业照明中的最新更新和独家内容。了解更多


OpenAI展开了GPT-4.1,即其新的未加工的大型语言模型(LLM),该模型与Chatgpt的用户平衡了高性能与较低的成本。该公司从Chatgpt Plus,Pro和Team上的付费订阅者开始,在接下来的几周内等待企业和教育用户的访问权限。

它还添加了GPT-4.1 Mini,该Mini替换为所有CHATGPT用户(包括自由级别)的GPT-4O MINI默认值。迷你版提供了一个较小的参数,因此具有相似的安全标准功能较小的版本。

可以通过在Chatgpt的聊天窗口的上角掉下“更多模型”来获得模型,该模型为用户提供了在GPT-4.1,GPT-4.1 Mini和推理模型(例如O3,O4-Mini和O4-Mini-High)之间进行选择的灵活性。

最初仅用于通过OpenAI(API)应用程序编程界面而仅由第三方软件和人工智能开发人员使用,GPT-4.1在强大的用户评论之后被添加到CHATGPT中。

培训后研究的主要研究Openai Michelle Crasses在X Shift中证实是由于写作的要求:“我们最初计划仅保存这种API模型,但您都希望在Chatgpt中使用它:)快乐的编码!”

Openai首席雇员Kevin Vale在X上发表,他说:“我们为开发人员建造了它,因此他非常擅长编码和培训致力于他们!”

面向企业的模型

GPT-4.1是从头开始开发的,以实现企业的实用性。

这是2025年4月与GPT-4.1 Mini和Nano一起启动的,这是模型家庭优先于开发人员的优先需求和使用生产的选择。

与SWE-Bench的GPT-4O相比,GPT-4.1提供了21.4点的改进,以及在多资源量表中专门针对指令的任务提高10.5分。与其他模型相比,这也将冗长降低了50%,即在早期测试中赞扬的企业用户。

上下文,速度和访问模型

GPT-4.1支持ChatGpt的标准上下文窗口:免费用户的8000个令牌,Plus用户的32,000个令牌和Pro用户的128,000个令牌。

根据X上发表的《天使天使的开发商》,这些限制与早期Chatgpt模型使用的限制相对应,尽管制定了计划进一步增加上下文的规模。

尽管GPT-4.1 API版本可以处理多达一百万个令牌,但该扩展的容器尚未在Chatgpt中可用,尽管未来的支持得到了暗示。

这种扩展的上下文可能性使API的用户可以向用于查看多域合同或分析大型杂志文件的模型提交整个代码库或大型法律和财务文件。

Openai认识到具有极大的输入数据的性能下降,但是企业的测试示例表明,稳定的性能高达几十万个令牌。

评估和安全

OpenAI还启动了有关安全评估的枢纽网站,以便为用户提供不同模型中关键绩效指标的访问。

GPT-4.1在这些估计中显示出可靠的结果。在实际的准确性测试中,他在SimpleQA测试中得分0.40,在PersonQA上得分为0.63,在几个前任之前。

在标准测试的拒绝测试中,他还以“非安全”度量得分为0.99,在更复杂的提示中得分为0.86。

尽管如此,在竞争条件GPT-4.1的安全性标准的Strongorodzh-Jilbreak测试中,GPT-4O-Mini和O3等模型得分为0.23。

尽管如此,他在与一个人的越狱提示上得分0.96,这表明典型使用的真实安全性更为可靠。

GPT-4.1指令的依从性遵循OpenAI(开发人员,用户记者的系统)的特定层次结构,得分为0.71,用于解决系统和用户消息的冲突。他还可以很好地保护受保护的短语并防止在辅导方案中的决策分布。

上下文化GPT-4.1针对前任

GPT-4.1的发布发生在GPT-4.5附近的支票后,这使其在2025年2月作为研究的初步观看。该模型强调了最佳的不受控制的培训,更丰富的知识库和幻觉C 61.8%的GPT-4O降低至37.1%。他还表现出了情感细微差别和长期形式的改善,但许多用户发现改进很薄。

尽管有这些好处,但GPT-4.5由于使用API​​的高价上涨至每百万个令牌,并与OpenAI模型相比,其价格高达每百万个令牌,并减少数学和控制指标。工业数据指出,尽管GPT-4.5在一般对话和内容的生成中更强,但在特定开发人员的应用中被低估了。

相反,GPT-4.1的目的是更快,更集中的替代方案。尽管他缺乏GPT-4.5和广泛的情感建模知识的广度,但他还是更好地配置了在编码和更可靠地遵守用户说明方面的实用帮助。

目前,在API OpenAI GPT-4.1上,一百万个输入令牌的价格为2.00美元,一百万现金令牌的0.50美元,令牌为8.00美元。

对于那些以较低成本在速度和情报之间保持平衡的人来说,Mini GPT-4.1的价格为每百万个输入令牌0.40美元,每百万美元现金令牌0.10美元,一百万个令牌的价格为1.60美元。

Google Flash-Lite和Flash型号可从0.075–0.10美元提供100万美元的输入令牌和0.30-0.40美元的售价为100万个令牌,这比GPT-4.1基本利率的成本低。

但是,尽管GPT-4.1价格更高,但它提供了软件开发的更强大控制指标和更准确的说明,这对于与成本相比需要可靠性的部署方案可能至关重要。最终,GPT-4.1 OpenAI为开发的准确性和效率提供了高级储备,而Google Gemini模型转向有意识的企业,需要灵活的模型和多模式功能。

这对做出企业决定的人意味着什么

GPT-4.1的引入带来了控制部署,编排和数据操作的企业的特定优势:

  • AI工程师控制LLM的部署 它可能会提高速度和依从性。对于控制LLM-OT模型设置周期的命令,它提供了一个更响应且有效的工具集,可以通过故障gpt-gpt-4.1消除。这特别适合在压力下倾斜命令,以便快速发送高性能模型,而不会危害安全性或合规性。
  • AI Orchestrovka领导 管道集中在管道的可扩展设计上,将意识到GPT-4.1与用户造成的大多数故障有关的可靠性及其在消息层次结构测试中的强劲性能。这促进了整合到编排系统中,这些系统确定了一致性的优先级,模型验证和工作的可靠性。
  • 数据工程师 负责维持高质量数据和新工具的集成将受益于GPT-4.1的较低幻觉和更高的实际准确性。即使团队资源有限,它更可预测的输出行为有助于创建可靠的数据工作流程。
  • 安全专家 在DevOps管道中引入安全性的任务可以在GPT-4.1对公共越狱及其受控的输出行为的抵抗中找到价值。尽管他对越狱抵抗的学术评估留下了改进的位置,但与与人相关的漏洞相比,该模型的高性能有助于将安全整合到内部工具中。

在这些角色上,GPT-4.1作为模型的定位(以清晰度,合规性和部署效率进行了优化),使其成为中型企业的令人信服的选择,努力使生产力与运营要求保持平衡。

向前迈出的新一步

尽管GPT-4.5是模型开发的扩展里程碑,但GPT-4.1侧重于效用。这不是最昂贵或最多模式的最昂贵的,但是它在与企业重要的领域中取得了重大成功:准确性,部署效率和成本。

该运动反映了更广泛的部门趋势 – 从最大的模型创建最大的模型以及在获得有能力的模型之前更加负担得起和改编。 GPT-4.1与此必需品相对应,为试图更深入地向其业务运营引入AI的团队提供了灵活的现成工具。

由于Openai继续开发其模型句子,GPT-4.1是公司环境高级AI民主化的一步。对于做出决定,平衡ROI可能性的人,他提供了一种更清晰的部署方式,而无需牺牲绩效或安全性。


Source link
Scroll to Top