加入我们的每日和每周信息选票,以获取人工智能领先的行业照明中的最新更新和独家内容。了解更多
罗格斯大学,蚂蚁小组和Salesforce Research的研究人员提出了一种新结构,允许人工智能代理执行更复杂的任务,从其环境中整合信息,并为复杂结构的发展创造自动相关的记忆。
命名的A-MEM,该框架使用大型语言(LLM)和向量嵌入的模型来从代理商的交互中提取有用的信息,并创建可以有效使用和使用的内存想法。随着企业努力将AI代理集成到其工作过程和应用中,可靠的内存管理系统的存在可能非常重要。
为什么LLM内存很重要
内存对于LLM和代理应用程序至关重要,因为它提供了工具和用户之间的长期交互。但是,当前的存储系统要么是无效的,要么基于预定的方案,这些方案可能与应用程序性质及其所面临的相互作用的变化不符。
研究人员写道:“这种僵化的结构与固定代理的工作过程相结合,极大地限制了这些系统在新环境中概括并在长期相互作用期间保持效率的能力。” “这项任务变得越来越重要,因为LLM代理解决了更复杂的开放任务,在这些任务中有必要灵活地组织和持续适应。”
A-MEM解释了
根据研究人员的说法,A-MEM介绍了代理存储器的体系结构,该体系结构为LLM代理提供了自主和灵活的内存管理。

每次LLM代理都与其环境进行交互,取决于是否访问工具或与用户的消息一起生成“结构性内存音符”,这既反映明显的信息和元数据,例如时间,上下文描述,相应的关键字和相关记忆。 LLM探索交互并创建语义组件时,LLM生成了一些细节。
创建内存后,使用编码器模型来计算嵌入所有组件的值。 LLM和嵌入性获得的LLM的组合既可以通过搜索相似性来提供解释的人类环境和有效搜索的工具。
随着时间的推移创建内存
A-MEM结构的有趣组成部分之一是无需预定规则即可连接各种内存音符的机制。对于每个新音符,A-MEM根据其集成值的相似性来标识最近的记忆。然后,LLM分析收到的候选人的全部内容,以选择最适合链接到新内存的候选人。
研究人员写道:“使用搜索的嵌入为初始过滤器,我们提供有效的可扩展性,同时保持语义意义。” “ A-MEM即使在大型内存集合中也可以快速识别潜在化合物,而无需进行详尽的比较。更重要的是,LLM控制的分析允许对超出简单相似指标的关系的细微理解。”
在创建新内存的链接后,A-MEM根据其文本信息以及与新内存的关系更新所获得的内存。由于随着时间的推移添加了更多的记忆,因此此过程阐明了系统知识的结构,这使您可以检测记忆中的最高顺序和概念模型。

在每种互动中,A-MEM都会使用上下文计划搜索内存,以向代理提供适当的历史信息。鉴于新的提示,A-MEM首先通过与用于内存音符相同的机制来计算其嵌入值。系统使用此实现从内存存储中提取最相关的记忆,并将初始线索增加到上下文信息,这有助于代理更好地理解和响应当前的交互。
研究人员写道:“已经获得了上下文,丰富了代理推理的过程,将当前的相互作用与存储在存储系统中的过去的经验和知识相结合。”
A-MEM在行动中
研究人员检查了a-Mem关于Locomo的A-MEM,这是一组涉及多个会话的长时间对话的数据。 Locomo包含复杂的任务,例如几个希望在几个聊天课程中需要合成信息的几个希望和需要理解与时间相关信息的合理问题。数据集还包含知识问题,需要从对话中与外部知识集成上下文信息。

实验表明,A-MEM在大多数任务类别中都超过了代理存储器的其他基本方法,尤其是在使用开源模型时。值得注意的是,研究人员说,A-MEM在降低退出成本时达到了出色的性能,回答问题时需要减少10倍的标记。
有效的内存管理成为主要要求,因为LLM代理被整合到不同领域和子系统的复杂公司工作流程中。 A-MEM的代码在GitHub上可用,是允许企业创建以内存加强创建LLM代理的几种结构之一。
每天有关VB每日业务使用方案的见解
如果您想打动老板,VB每天都会覆盖您。我们为您提供有关公司对生成AI的影响的内部勺子,从监管转变到实际部署,因此您可以分享对最大投资盈利能力的了解。
阅读我们的保密政策
感谢您的订阅。在此处查看更多VB信息选票。
发生错误。

Source link