北京讯 – 阿里巴巴通义实验室近日发布了一款名为WebShaper的AI训练数据合成系统,旨在为AI智能体(Agent)的训练提供高质量、可扩展的数据,从而推动AI在复杂信息检索任务中的应用。

WebShaper的核心在于其创新的数据合成方法,它并非依赖于传统的预检索数据,而是通过形式化建模和智能体扩展机制,让AI自己“出题”,生成可控、可解释、可扩展的高质量任务。

形式化建模:知识投影的妙用

WebShaper首次引入了基于集合论的“知识投影”(Knowledge Projection, KP)概念。简单来说,KP就是一个包含特定实体的集合。通过对这些集合进行交集、并集和递归操作,WebShaper能够构造复杂的问题结构,并精准控制推理路径和任务复杂度。

例如,在处理“2000-2010年参赛的球员”这类具有不确定性条件的问题时,WebShaper可以通过并集操作轻松解决;而对于“2000年参赛且90年代出生的球员”这类多条件约束问题,则可利用交集操作进行处理。

智能体扩展:AI自己当“出题人”

WebShaper的另一大亮点是其智能体扩展机制。系统从一个简单的“种子问题”出发,通过Expander智能体逐步扩展成复杂的推理任务。Expander智能体能够调用搜索、摘要、验证等工具,逐步构造出更复杂、逻辑清晰的问题,并验证答案的正确性。这种机制确保了推理链条的清晰,以及任务结构的可控性。

Agent训练策略:监督微调与强化学习的结合

在训练策略上,WebShaper采用了监督微调(SFT)和GRPO强化学习的组合策略,使AI智能体在模糊、多跳信息中逐步掌握推理与检索能力。训练从高质量的训练轨迹开始,通过奖励机制引导模型进行多步推理,避免“走捷径”或“猜答案”。

技术原理:形式化驱动框架

WebShaper采用集合论对信息检索任务进行系统形式化,其核心是“知识投影”(Knowledge Projections, KP)概念。KP是基于特定关系的实体集合,通过知识投影操作,可以实现对复杂问题的分解和处理。

应用场景:潜力无限

WebShaper的应用场景十分广泛,包括:

  • 文献整理与分析: 帮助研究人员快速收集和整理相关文献,进行跨学科的知识发现。
  • 市场调研: 用于市场调研、竞争分析和投资决策支持。
  • 智能学习助手: 帮助学生进行深度学习和研究性学习。
  • 生活决策: 在出行规划、健康查询、生活决策等场景下,为用户提供个性化的信息支持。
  • 医疗信息查询: 帮助用户查询医疗健康信息,提供专业的医疗建议和健康咨询。

项目地址:

结论:

WebShaper的推出,标志着AI训练数据合成技术迈出了重要一步。通过形式化建模和智能体扩展机制,WebShaper有望解决AI智能体训练中数据质量和可扩展性的难题,为AI在更多领域的应用提供强有力的支持。未来,随着技术的不断发展,我们有理由相信,WebShaper将在推动AI技术进步的道路上发挥更大的作用。


>>> Read more <<<

Views: 0

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注