Omne:通过多智能体合作 解决AI长期记忆能力并提高AI推理能力

长期记忆(LTM)是AI自进化的核心,它允许模型通过与环境的持续交互,累积并存储经验数据。这些数据可以在未来的任务中被模型使用,从而增强模型在新环境中的应对能力。

近日,来自天桥脑科学研究院(Tianqiao and Chrissy Chen Institute,简称TCCI)的AI团队提出了一套系统化的数据采集框架Omne多代理框架,用于构建LTM。该框架能够从模型与外界的交互中收集多样化、个性化的数据,包括数字痕迹、行为数据、生物特征等。这些数据在经过处理和整理后,能够有效存储在LTM中。

Omne旨在通过多个智能体之间的协作、信息共享和长期记忆(LTM)的应用,促进 AI 系统的自我进化和个性化优化。

Omne的每个智能体都拥有相同且独立的系统结构,能够自主学习并存储完整的世界模型,从而独立构建对环境的理解。通过这种基于LTM 的协作开发,AI 系统能够实时适应个体行为的变化,优化任务规划与执行,进一步推动个性化与高效的AI 自我进化过程。

OMNE 框架在全球AI代理基准测试系统 GAIA(Global Artificial Intelligence Agent Benchmark)中在GAIA智能体系排行榜上荣登榜首,超越了众多顶尖研究机构,包括微软研究院的相关框架。

本次榜单的的重大突破在于融合了长期记忆的机制,通过长期记忆大幅降低了MCTS的搜索空间,提高了在复杂问题上的决策能力。通过引入更高效的逻辑推理,OMNE不仅提升了单个智能体的智能水平,还通过优化协作机制,显著增强了多智能体系统的整体能力。这一提升机制正是受到了人类大脑皮层柱状结构研究的启发,皮质柱作为大脑认知和行为功能的基础单元,通过复杂的协作机制实现信息处理。AI模型通过强化单体智能与智能体间的协作,可能逐渐产生认知能力的涌现,构建出内部的表征模型,进而推动系统整体智能的飞跃。

这是自去年天桥脑科学研究院创始人、前中国互联网大佬陈天桥宣布All In AI战略以来,团队取得的一项重大成果。

 

OMNE 框架的核心概念

OMNE 的核心功能和特点:

  1. 多智能体协作机制
    • 在 OMNE 框架中,多个智能体共同工作,每个智能体都有独立的长期记忆(LTM),并能够根据自己的交互经验学习和优化。这些智能体之间可以共享数据、经验和知识,进一步增强系统的整体性能。
    • 这种多智能体系统允许智能体之间协同工作,分工处理不同的任务,充分发挥各自的优势,从而能够更好地应对复杂和多样化的任务环境。
  2. 个性化与动态调整
    • OMNE 框架中的每个智能体通过自己的LTM数据与外部环境互动,并逐渐形成个性化的学习路径。这意味着每个智能体可以在不同的任务场景中逐步进化,具备个性化处理能力。
    • 这种个性化不仅在于不同智能体之间的能力差异,还体现在单个智能体能够根据任务要求进行自我调整,使其能够持续适应动态变化的环境和个体需求。
  3. 数据共享与信息协作
    • OMNE 允许智能体之间共享信息、数据和学习成果。这种共享机制能够大幅提升系统的整体表现。例如,当一个智能体在某一任务中积累了有价值的知识,其他智能体可以通过信息共享直接受益,减少重复学习的成本,提升学习效率。
    • 这种信息共享还能够解决单个智能体在面临数据稀疏或未知任务时的挑战,通过协作和信息交换使系统具备更强的鲁棒性和泛化能力。
  4. LTM在OMNE中的应用
    • OMNE 的智能体依赖长期记忆(LTM)来存储和管理它们在与环境长期交互过程中所获得的数据。LTM 在 OMNE 中充当了关键的机制,使智能体能够通过积累和利用历史数据不断优化自身的推理、决策和行为能力。
    • LTM 数据不仅为单个智能体提供了持续学习的基础,还能够通过智能体之间的分享,帮助整个系统共同进步。
  5. 适用于多场景和复杂任务
    • OMNE 框架特别适用于那些需要多个智能体协作、长期学习和动态调整的复杂任务场景。例如,在医疗、金融、智能办公等应用领域,OMNE 可以通过个性化智能体的协作与长期记忆数据的使用,提供更精确、更高效的决策支持。
    • OMNE 在 GAIA 基准测试中取得了优异成绩,证明了这种多智能体协作和自进化机制在实际应用中的强大潜力。

OMNE 框架的技术架构

OMNE 框架基于 OpenAI 的 GPT-4oo1-preview 开发。OMNE 使用了这两个模型作为基础,同时还配备了四个工具:Web 浏览器、必应搜索引擎、基于 LlamaParse 的文件读取器,以及一个利用 o1-preview 构建的逻辑专家​。

OMNE 中的每个智能体独立运行,同时基于 GPT-4o 和 o1-preview 的能力进行个性化学习。OMNE 的多智能体架构允许各智能体在不同任务下相互协作,从而实现整体系统的自我进化。

对GPT O1-preview的优化

Omne框架对GPT O1-preview版本进行了优化,特别是工具调用机制的改进,显著提升了系统的推理能力。

Omne 框架对工具调用机制进行了专门的优化,这项改进主要表现在以下几个方面:

推理能力的显著提升

Omne 框架的工具调用机制优化极大提升了 GPT O1-preview 的推理能力,主要体现在以下几个方面:

四个工具

OMNE 框架的架构

OMNE 框架的架构由由多个关键组件组成,这些组件协同工作以实现智能体之间的高效协作和任务处理:

OMNE 框架中的智能体类型

OMNE 框架内的智能体根据任务不同,分为不同类型,每个智能体在系统中的角色各有侧重。以下是几个典型的智能体类型:

OMNE 在 GAIA 基准测试中的表现

OMNE 框架在全球AI代理基准测试系统 GAIA(Global Artificial Intelligence Agent Benchmark)中取得了卓越成绩,超越了众多顶尖的AI系统:

应用案例

OMNE 框架应用场景非常广泛,比如提升生产力、医学诊断等,尤其是通过长时记忆(LTM)和多智能体系统的集成来实现 AI 的自我进化和高效任务处理。以下是 OMNE 框架在组织协作和医疗应用中的一些关键案例:

1.赋能高效的组织协作

OMNE目前被应用于Tanka – 全球第一个带长期记忆的团队协作IM。Tanka 是一款为团队设计的沟通工具,结合了 AI 和认知记忆以提升协作效率。它提供了基于聊天的工作环境,帮助跟踪团队进度,并将数据转化为长期记忆。Tanka 的 AI 助手能管理沟通、优先处理任务,并提供智能回复,适用于科技初创公司、教育机构等多种组织。Tanka 9月底刚刚上架全球appstore,目前还在waitlist邀测阶段。在 Tanka 中整合 OMNE 框架的功能可以通过以下策略实现,重点在于多智能体协作和数据共享:

通过这些策略,OMNE 框架能够在 Tanka 中实现更高效的多智能体协作和数据共享,提升团队协作效率和决策支持能力。

2. 多语言适应性与推理能力
3. 复杂任务规划与内存利用
4. 诊断对话系统中的心理健康应用

据悉,目前TCCI已经建立起了一支上百人的优秀AI工程师团队,还在全球持续招募。另外,近期TCCI还与Science杂志推出了全球AI驱动科学大奖,以及举办各种高水平国际会议、夏校,持续培养青年AI跨学科人才。

论文:https://arxiv.org/pdf/2410.15665
退出移动版