谷歌发布CoA：多智能体协作新框架

摘要： 谷歌近日发布了一款名为CoA（Chain-of-Agents）的多智能体协作框架，旨在解决大型语言模型（LLM）在处理长文本任务时遇到的上下文长度限制问题。该框架通过将长文本分割成多个片段，由多个智能体协同处理，最终整合信息，从而显著提升了长文本处理的性能和效率。

正文：

在人工智能领域，大型语言模型（LLM）正日益成为推动技术进步的关键力量。然而，LLM在处理长文本时，常常面临上下文长度的限制，这严重制约了其在诸多实际应用中的表现。为了突破这一瓶颈，谷歌推出了全新的多智能体协作框架——CoA（Chain-of-Agents）。

CoA的核心思想是将长文本分割成多个较短的片段，然后分配给多个“工作智能体”（worker agents）依次处理。每个工作智能体负责分析其所分配的文本片段，提取关键信息，并通过链式通信将这些信息传递给下一个智能体。最终，一个“管理智能体”（manager agent）将整合所有工作智能体的信息，生成最终的输出结果。

这一框架的设计理念巧妙地解决了LLM的上下文限制问题。通过将长文本分解为多个小块，每个智能体只需关注较短的上下文，从而避免了注意力分散和信息丢失。同时，链式通信机制确保了关键信息在智能体之间有效传递，最终由管理智能体进行全局整合。

CoA框架的主要优势：

分段处理与链式通信： 将长文本分解为多个片段，由多个工作智能体依次处理，并通过链式通信传递关键信息。
信息聚合与上下文推理： 工作智能体传递关键信息，最终由管理智能体整合所有信息，生成一致的输出。
任务无关与无需训练： CoA框架无需额外训练，适用于多种任务类型，如问答、摘要和代码补全等。
性能与效率提升： 通过多智能体协作，显著提升了长文本任务的性能，最高可达10%，并将时间复杂度从平方复杂度降低到线性复杂度。
可扩展性： 可以通过调整工作智能体的数量来适应不同长度的输入，具有良好的可扩展性。

CoA的设计原理：

CoA框架的核心在于多智能体协作与信息聚合。在第一阶段，工作智能体依次读取和处理文本片段，将关键信息传递给下一个智能体。每个智能体接收来自前一个智能体的信息，更新自己的处理结果。最终，管理智能体接收所有工作智能体的输出，整合信息生成最终答案。

通过自然语言通信实现多智能体之间的协作，每个智能体专注于较短的上下文，缓解了长上下文中的注意力集中问题。CoA的时间复杂度从传统的平方复杂度（O(n²)）降到了线性复杂度（O(nk)），其中n是输入tokens的数量，k是LLM的上下文限制，显著降低了计算成本，处理长文本任务更加高效。

CoA的应用场景：

CoA框架的应用前景十分广阔，尤其是在需要处理长文本的任务中，例如：

长文本问答： CoA能处理复杂的多跳推理问题。例如，在处理家族关系推理时，长文本被分割成多个片段，工作智能体依次处理这些片段并传递关键信息，最终由管理智能体生成答案。
长文本摘要： 在长文本摘要任务中，CoA通过分块处理和多智能体协作，能有效地提取关键信息并生成准确的摘要。
代码补全： CoA可以应用于代码补全任务。通过多智能体协作，CoA能处理长代码片段，提取关键信息并生成代码补全建议。
多领域任务： CoA框架具有高度的灵活性和任务无关性，能与多种大语言模型（LLM）协同工作。

结论：

谷歌推出的CoA多智能体协作框架，为解决LLM在处理长文本时遇到的挑战提供了一种全新的思路。通过分段处理、链式通信和信息聚合，CoA不仅提升了长文本处理的性能和效率，还降低了计算成本。随着人工智能技术的不断发展，CoA有望在长文本问答、摘要、代码补全等多个领域发挥重要作用，推动LLM在实际应用中取得更大的突破。

参考文献：