周日. 6 月 21st, 2026

SpatialVLA：国产空间具身通用模型问世

作者智能小编

3 月 7, 2025 #spatialvla, #具身, #每日AI快讯

shanghai

shanghai

上海，[日期] – 上海人工智能实验室（Shanghai AI Lab）联合中国电信人工智能研究院、上海科技大学等机构，近日推出了一款名为SpatialVLA（Spatial Vision-Language-Action）的创新型空间具身通用操作模型。该模型旨在通过赋予机器人强大的3D空间理解能力，实现跨平台、零样本泛化控制，为机器人领域的研究和应用开辟新的技术路径。

SpatialVLA：机器人通用智能的关键一步

SpatialVLA的发布，标志着机器人通用智能领域迈出了重要一步。长期以来，机器人应用面临着环境适应性差、任务泛化能力弱等挑战。SpatialVLA的出现，有望打破这些瓶颈，让机器人能够在更复杂、更动态的环境中执行任务。

技术原理：Ego3D位置编码与自适应动作网格

SpatialVLA的核心技术在于其独特的空间理解和动作控制机制：

Ego3D位置编码： 模型将深度信息与2D语义特征相结合，构建以机器人为中心的3D坐标系。这种方法消除了对特定机器人-相机校准的依赖，使模型能够感知3D场景结构，并适应不同的机器人平台。
自适应动作网格： 模型将连续的机器人动作离散化为自适应网格，并基于数据分布划分动作空间。这种方法使得不同机器人的动作用网格对齐，从而实现跨平台的动作泛化和迁移。

此外，SpatialVLA还采用了空间嵌入适应技术，在微调阶段，可以根据新机器人的动作分布重新划分网格，调整空间嵌入，从而提供灵活且高效的机器人特定后训练方法，加速模型适应新环境。

主要功能：零样本泛化与高效适应

SpatialVLA具备以下主要功能：

零样本泛化控制： 无需额外训练，即可在未见过的机器人任务和环境中直接执行操作。
高效适应新场景： 通过少量数据微调，能够快速适应新的机器人平台或任务。
强大的空间理解能力： 能够理解复杂的3D空间布局，执行精准的操作任务，如物体定位、抓取和放置。
跨机器人平台的通用性： 支持多种机器人形态和配置，实现通用的操作策略。
快速推理与高效动作生成： 基于离散化动作空间，提高模型推理速度，适合实时机器人控制。

应用前景：工业、物流、服务、医疗等多领域

SpatialVLA的应用前景广阔，有望在多个领域发挥重要作用：

工业制造： 用于自动化装配和零件搬运，快速适应不同生产线，提高生产效率。
物流仓储： 精准抓取和搬运货物，适应动态环境，优化物流效率。
服务行业： 完成递送、清洁和整理任务，理解自然语言指令，适应复杂环境。
医疗辅助： 传递手术器械、搬运药品，确保操作精准和安全。
教育与研究： 支持快速开发和测试新机器人应用，助力学术研究。

开源与开放：助力机器人领域发展

上海AI Lab已将SpatialVLA开源，并提供了灵活的微调机制，为机器人领域的研究和应用提供了新的技术路径。

项目官网： https://spatialvla.github.io/
GitHub仓库： https://github.com/SpatialVLA/SpatialVLA
HuggingFace模型库： https://huggingface.co/IPEC-COMMUNITY/foundation-vision-language-action-model
arXiv技术论文： https://arxiv.org/pdf/2501.15830

结论：开启机器人通用智能新时代

SpatialVLA的发布，是机器人通用智能领域的一项重要突破。其强大的空间理解能力、零样本泛化能力以及跨平台通用性，为机器人应用带来了无限可能。随着SpatialVLA的不断发展和完善，我们有理由相信，机器人将在未来的生产和生活中扮演更加重要的角色。

参考文献：

SpatialVLA GitHub Repository: https://github.com/SpatialVLA/SpatialVLA
SpatialVLA Project Website: https://spatialvla.github.io/
SpatialVLA arXiv Paper: https://arxiv.org/pdf/2501.15830
IPEC-COMMUNITY Hugging Face: https://huggingface.co/IPEC-COMMUNITY/foundation-vision-language-action-model

>>> Read more <<<

Views: 2

相关文章

AI生成 NEWS 公司估值智能新闻

永新光学 (603297.SH) ：国产替代与新兴业务驱动下的价值重估

2 月 7, 2026 既智

AI生成 NEWS 智能新闻

来伊份：转型阵痛中的价值重塑与未来突围

12 月 26, 2025 既智

AI生成 NEWS 智能新闻

北方稀土 (600111.SH): 战略核心资产的价值重估——迎接“戴维斯双击”

12 月 26, 2025 既智

发表回复取消回复

图库

90年代申花出租车司机夜晚在车内看文汇报

黄山的油菜花

90年代的黄河路

shanghai

上海的陆家嘴

上海的陆家嘴

在上海浦东滨江公园观赏外滩建筑群-20240824

上海枫泾古镇一角_20240824

上海宝山炮台湿地公园的蓝天白云

为您推荐

AI生成 NEWS 公司估值智能新闻

永新光学 (603297.SH) ：国产替代与新兴业务驱动下的价值重估

2026年2月7日

AI生成 NEWS 智能新闻

来伊份：转型阵痛中的价值重塑与未来突围

2025年12月26日

AI生成 NEWS 智能新闻

北方稀土 (600111.SH): 战略核心资产的价值重估——迎接“戴维斯双击”

2025年12月26日

AI生成 NEWS 公司估值

国之重器，芯之所向：新周期与大国博弈下的中芯国际(688981.SH)价值重估

2025年12月26日