NEWS 新闻NEWS 新闻

“`markdown

蚂蚁数科、清华联手打造 BodyGen 框架,助力机器人“自主进化” | ICLR 2025 Spotlight

摘要: 蚂蚁数科与清华大学联合团队在 ICLR 2025 上凭借其具身协同框架 BodyGen 荣获 Spotlight 殊荣。该框架利用强化学习和深度神经网络技术,使机器人能够在短时间内自主演化出适应环境的最优形态和控制策略,为具身智能的加速进化提供了新思路。

北京 – 在人工智能领域,让机器人像生物一样自主进化一直是研究人员的梦想。近日,蚂蚁数科与清华大学联合团队在这一领域取得了重大突破。他们在即将举行的国际顶级人工智能与机器学习会议 ICLR 2025 上,凭借其名为 BodyGen 的具身协同框架成功入选 Spotlight 论文,引发了业界广泛关注。

论文题目: BodyGen: Advancing Towards Efficient Embodiment Co-Design
论文地址: https://arxiv.org/abs/2503.00533
项目代码: https://github.com/GenesisOrigin/BodyGen

自主进化:机器人研究的新方向

自然界生物历经数百万年的进化,拥有了与环境完美契合的身体结构和交互能力。然而,传统机器人的设计高度依赖人类专家的知识,且需要针对特定环境进行大量的实验和迭代,成本高昂且效率低下。

受生物进化启发,形态控制协同设计(Co-Design)技术应运而生。该技术旨在让机器人模仿生物进化过程,在优化控制策略(“大脑”)的同时演化自身形态(“形体结构、关节参数”),从而适应复杂环境。然而,该领域长期面临两大挑战:

  1. 巨大的形体搜索空间: 难以在有限时间内穷举所有可能的机器人形态。
  2. 形态与控制策略的深度耦合: 评估每一个候选形态设计需要消耗大量的计算资源。

BodyGen:强化学习驱动的自主进化

为了解决上述难题,蚂蚁数科与清华大学的研究团队提出了 BodyGen 框架。该框架利用强化学习实现了端到端的高效形态-控制协同设计。

BodyGen 将形体设计过程划分为两个连续阶段:

  • 形态设计阶段: 引入 Transformer(GPT-Style)自回归地构建机器人的形体结构并优化参数。
  • 环境交互阶段: 使用 Transformer(Bert-Style)对机器人的每一个关节信息进行集中处理并发送到对应关节马达,与环境交互并获得反馈。

通过几轮迭代,BodyGen 能够快速生成当前环境的最佳机器人形态和相应的控制策略。

BodyGen 的三大核心技术点

BodyGen 的核心在于其生物启发式的训练框架,它使用深度强化学习进行端到端的形态-控制协同设计。该框架包含三项核心技术:

  1. TopoPE 轻量级的形体结构位置编码器: 类似于机器人的“身体感知”系统,通过给机器人每个部位贴上“智能标签”,使 AI 能够理解“这是腿”、“这是手臂”等,从而快速适应并控制新的身体结构。

  2. MoSAT 基于 Transformer 的集中式的神经中枢处理网络: 类似于机器人的“大脑中枢”,收集机器人各个部位的信息(位置、速度等),在 Transformer 网络中进行集中处理,并将处理后的信息转化为具体动作指令。

  3. 时序信用分配机制下的协同设计: 允许 AI 同时负责设计机器人的身体和控制机器人的动作。通过特殊的“奖励分配机制”,AI 能够合理评估自己的设计决策,避免因短期效果不明显而放弃可能很好的设计。

技术细节:TopoPE 和 MoSAT 的深入解析

  • TopoPE (Topology-Aware Positional Encoding): 在人脑中,来自身体不同区域的信号会被传输到特定的神经区域进行处理,这隐含了消息来源的位置信息。对于机器人,同样需要高效的形体信息表征。在 BodyGen 中,TopoPE 通过哈希映射,将机器人肢体到根肢体的路径映射为唯一的嵌入(Embedding),有效解决了形体演化过程中的索引偏移问题,从而促进了协同设计过程中相似形态机器人的知识对齐和共享。

  • MoSAT (Modular Spatial Attention Transformer): 为了通用表征形体空间中的各种各样的机器人,作者使用标准序列模型 Transformer 处理拓扑结构可变的机器人形体。机器人的每一个关节信息都会经过「编码」-「集中处理」-「解码」三个阶段,最终生成动作信号:信息编码:来自不同肢体的信息首先会携带其拓扑位置信息首先通过编码层进行信号编码集中处理:这些编码后的信息会输入到 Transformer 网络中进行集中处理,学习各个肢体之间的关系,并进行全局的决策解码:解码层将 Transformer 网络输出的信号解码为各个关节的动作信号,控制机器人的运动。

开源代码:助力具身智能研究

BodyGen 团队已将相关代码开源至 GitHub 仓库 (https://github.com/GenesisOrigin/BodyGen),供研究人员和开发者使用。

ICLR 2025:人工智能领域的盛会

ICLR (International Conference on Learning Representations) 是全球 AI 和机器学习领域的顶级会议之一。本届大会共收到 11672 篇论文,被选中做 Spotlight(聚光灯/特别关注)或者 Oral Presentation(口头报告)的比例约为 5.1%。

结论与展望

蚂蚁数科与清华大学联合团队提出的 BodyGen 框架,为机器人自主进化提供了一种全新的解决方案。该框架不仅在理论上具有创新性,而且在实践中也展现出了巨大的潜力。未来,随着计算能力的不断提升和算法的不断完善,我们有望看到更多具有自主进化能力的机器人涌现,并在各个领域发挥重要作用。

参考文献:

致谢: 感谢蚂蚁数科与清华大学联合团队提供的信息和资料。
“`


>>> Read more <<<

Views: 4

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注