加入我们的每日和每周信息选票,以获取人工智能领先的行业照明中的最新更新和独家内容。了解更多
微软引入了一类新的高效人工智能模型,同时处理文本,图像和语音,同时需要比现有系统明显更低的计算能力。今天发布的新的PHI-4模型是小语言模型(SLM)的开发中的突破,该模型为以前为更大的AI系统提供了保留的机会。
根据技术报告Microsoft的数据,PHI-4-MimultiModal的参数仅为56亿和PHI-4-MINI,参数为38亿个,超过了相似大小的竞争对手,甚至超过了某些任务的模型性能或超过模型的性能。
“这些模型旨在扩大AI功能扩展的开发人员的功能,” Microsoft生成人造艺术副总裁Veihu Chen说。 “ Phi-4-Multimodal具有同时处理语音,愿景和文本的能力,为创建创新和上下文应用程序开辟了新的机会。”
在企业越来越多地寻找可以在标准设备或“区域”上使用的人工智能模型(直接在设备而不是云数据中心)上的人工智能模型的时候,实现了技术成就,以降低成本和延迟,同时保持数据隐私。
微软如何建立了一个小型人工智能模型,该模型可以完成一切
分别区分Phi-4-Multimodal的是一种新的“ Lorace混合物”,它允许其处理同一模型中的文本,图像和语音入口。
研究文章说:“使用洛拉斯混合物,Phi-4-MultModal扩展了多模式的功能,同时最大程度地减少了方法之间的干扰。” “这种方法提供了无缝集成,并在包括文本,图像和语音/音频在内的任务之间提供了恒定的生产力。”
创新使该模型能够保持其强大的语言能力,增加对语音的视野和识别性能而不会恶化的性能,这通常是在模型适用于几种类型的输入时会发生的。
该模型声称在OpenASR领导者表中的上位置,误差频率为6.14%,领先于诸如Wesperv3之类的专业语音识别系统。它还在视觉任务中表现出竞争性有效性,例如与图像的数学和科学推理。
紧凑的AI,巨大的影响:PHI-4-MINI设定了新的性能标准
尽管大小紧凑,但Phi-4-Mini在文本问题中表现出了出色的功能。微软报告说,该模型“超过了相似大小的模型,并且位于各种语言指标的派对中,其模型是型号的两倍”。
该模型在数学和编码任务中的生产力尤为明显。根据研究工作,“ PHI-4-MINI由32层变压器组成,其隐藏状态大小为3 072”,并包括一个小组注意请求,以优化使用内存来生成长上下文。
在数学标准上,GSM-8K PHI-4-MINI达到88.6%,比大多数参数提前80亿,而在数学方面,它达到了64%,比相似大小的竞争对手高得多。
“对于数学标准,该模型超出了具有相同大小的模型,有时超过20点。它甚至超出了对较大模型的评估。”技术报告指出。
转型部署:实际效率PHI-4在行动
能力,对AI的响应机制可帮助组织结合各种数据集,已经使用PHI家族来提高其平台的效率和准确性。
产品部门负责人史蒂夫·弗雷德里克森(Steve Frederickson)在声明中说:“从我们的最初实验中,这确实给我们留下了深刻的印象,即他的精彩准确性和简单的部署,甚至在配置之前。从那时起,我们就能够提高准确性和可靠性,同时保持我们从一开始就欣赏的经济效率和可扩展性。”
与竞争工作流程相比,节省成本的容量已报告了4.2倍,在初步处理任务中取得了相同或更好的定性结果。
无限制的人工智能:Microsoft PHI-4模型在任何地方带来了扩展的智能
多年来,AI的发展归因于唯一的哲学:更好。更多参数,较大的模型,大型计算要求。但是Microsoft PHI-4模型挑战了这一假设,证明功率不仅在规模上是有效性。
Phi-4-Multimodal和Phi-4-Mini不是为技术巨头数据中心设计的,而是在现实世界中 – 计算能力有限,机密性问题至关重要,AI应该在不持续与云连接的情况下使用。这些型号很小,但它们具有重量。 PHI-4-MultiModal将语音,视觉和文本的处理结合到一个系统中,而无需牺牲准确性,而Phi-4-Mini则提供数学,编码和生产力以及模型。
这不仅是为了使人工智能更加有效;这是关于使其更实惠。 Microsoft将PHI-4定位为广泛的分布,使其通过铸造Azure AI,Nvidia API的拥抱脸和目录提供。目的是明确的:AI,它不会被昂贵的设备或大型基础设施所阻止,但可以在标准设备,网络边缘和计算能力较小的行业上工作。
日本公司AI Headwaters Co.,Ltd。的主任Masayia Nishimaki看到了第一手的影响。他在一份声明中说:“ Edge AI即使在周三具有不稳定的网络连接或机密性至关重要的地方也表现出了出色的性能。”这意味着可以在工厂,医院,自动驾驶汽车空间中运作的AI,在该空间中需要实时智能,但传统的云模型失败。
PHI-4的核心是思维的转变。 AI不仅是那些拥有最大服务器和最深口袋的人的工具。这种能力,如果设计精良,可以在任何地方工作。 PHI-4中最革命性的事情不是他能做的就是他能做的。
每天有关VB每日业务使用方案的见解
如果您想打动老板,VB每天都会覆盖您。我们为您提供有关公司对生成AI的影响的内部勺子,从监管转变到实际部署,因此您可以分享对最大投资盈利能力的了解。
阅读我们的保密政策
感谢您的订阅。在此处查看更多VB信息选票。
发生错误。

Source link