在人工智能领域加速演进的关键时刻,一个面向通用机器人、旨在推动其从专用走向通用的新时代正悄然来临。11月20日,在北京举行的“2025智源具身智能开放日”活动上,智源研究院公布了其在具身智能这一前沿领域的核心科研布局。此次发布涵盖了模型、数据、评测及工具链等多个关键环节,旨在构建一个强大的、面向通用机器人的具身大模型系统,并以开源开放的模式,为构建稳固的具身智能公共基础设施奠定基础。
突破痛点,引领具身智能新方向
当前,具身智能技术正快速发展并迈入“深水区”。然而,行业普遍面临着技术演进与实际应用落地加速的需求,亟需一个开放、协同、标准化的生态系统来支撑这一进程。智源研究院院长王仲远在活动中指出,人工智能正站在一个新的历史拐点上,推动机器人从只能执行单一任务的“1.0专用机器人时代”,向能够适应复杂环境、具备广泛泛化能力的“2.0通用具身智能时代”迈进。但他同时也坦言,当前许多具身大模型在实际应用中仍然存在“不好用、不通用、不易用”等核心痛点,限制了其推广和普及。
全栈布局,构筑具身智能公共底座
为了攻克这些瓶颈,智源研究院已构建了一个以“具身大脑”为核心的全栈式具身智能技术体系。这一体系自底向上,贯穿了具身智能发展的各个关键环节。它包括:
异构本体数据采集与标准化平台: 能够处理来自不同类型机器人本体的海量数据,并提供标准化的采集与管理解决方案。
具身大小脑及VLA等基座模型: 研发了包括“具身大脑”在内的多项核心基座模型,以及VLA(视觉-语言-动作)等模型,为具身智能提供强大的认知和决策能力。
具身智能评测体系: 建立了一套科学、严谨的评测标准和平台,用于评估和衡量具身智能系统的性能。
这套完整的体系旨在为具身技术生态提供一套可复现、可对齐的公共基础设施,显著降低技术从实验室研究走向产业化落地的门槛,加速创新成果的转化应用。
模型创新:提升泛化性与交互体验
在模型与框架方面,智源研究院推出了RoboBrain 2.0 Pro。该模型在原有的通用具身大脑基础上,进一步引入了RoboBrain-Dopamine和RoboBrain-SpatialTrace。前者专注于提升机器人对动作时序价值的理解与优化,后者则强化了机器人对三维空间结构及其关系的推理能力。通过这两项技术的融合,机器人的泛化性得到了显著提升,使其能够更好地适应复杂多变的环境。
在人机交互领域,智源研究院推出了RoboBrain-Audio,一款原生全双工语音大模型,能够实现更自然、流畅的语音交互。同时,配合RoboBrain-Memory,一个先进的终身认知记忆系统,共同赋能各种人机交互场景。无论是商场内的导购服务,还是家庭环境下的陪伴机器人,都能够提供更加出色的人机交互体验,使机器人更加“懂你”。
携手共进,加速产业落地
智源研究院深知,具身智能的快速发展离不开开放合作。目前,智源在具身智能领域的合作伙伴已超过30家。未来,研究院将持续迭代更新其开源项目、数据集和评测平台,并同步向公众公布进展。同时,智源将积极与产业伙伴推进联合试点项目,通过“产研结合”的模式,加速具身智能技术从实验室的创新研究,真正走向生产线的实际应用,共同开启通用机器人的新篇章。










