摩根士丹利机器人年鉴揭示:机器人迈向“身体智能”时代,边缘计算需求将激增
摩根士丹利最新发布的《机器人年鉴(第二卷)》指出,在人工智能的推动下,机器人行业正经历一场深刻变革。传统上主要用于工厂生产的机器人,正逐步进入家庭、城市、农业乃至太空等非结构化环境。与此同时,行业训练重点也从以通用AI模型为主的“大脑”优化,转向更注重物理操控能力的“身体”控制。
这一转型不仅意味着机器人应用场景的拓宽,也预示着边缘计算需求的大幅上升。报告强调,机器人在复杂现实环境中执行任务时,需要更高水平的实时感知与精准操作,这将促使分布式边缘算力成为关键技术基础设施。
从工厂“结构化牢笼”走向开放世界的挑战
传统工业机器人受限于结构化环境,通常用于固定产线上的重复性任务,其运行依赖预设程序,对环境感知和学习能力的要求较低。
而如今,AI赋能的新一代机器人已开始在更复杂的场景中运作,例如:自动驾驶汽车在城市交通中导航,服务机器人完成家庭物品抓取任务,以及无人机在复杂地形执行巡检。这些场景对机器人的实时感知、动态调整和精细操作提出了更高要求。
报告以“从冰箱中取出一瓶饮料”这一日常动作举例,指出看似简单的操作背后,涉及多维度的技术难题,包括手指位置的精确控制、身体平衡调整、抓取力度的判断,以及环境湿度对摩擦力的影响等。这些挑战表明,现代机器人必须具备更强大的实时决策与动作执行能力。
训练模式演进:从AI“大脑”到“身体”控制
早期的机器人训练主要聚焦在AI模型层面,如优化视觉-语言模型(VLM)。然而,随着技术发展,当前的瓶颈已转向物理执行层面,尤其是在行走、抓取等人类本能技能方面。
报告指出,这类基础动作对于AI来说极具挑战性,因为它们无法通过常规的文本或图像数据训练获得。机器人必须依赖大量现实世界的操作数据,才能掌握复杂环境下的精准控制。
为此,科技巨头如特斯拉、英伟达和谷歌正在探索三种主要的数据收集方式:远程操作、模拟训练以及视频学习。
- 远程操作(Teleoperation):通过动作捕捉设备由人类远程控制机器人,虽然直观但扩展性有限。
- 模拟训练(Simulation):利用数字孪生技术在虚拟环境中复现真实场景,结合强化学习优化动作控制。游戏引擎厂商如Unreal Engine和Unity已深度参与相关开发。
- 视频学习(Videos):通过分析人类行为视频,提取动作模式用于模型训练。谷歌DeepMind的Genie 3和Meta的V-JEPA 2等模型,正尝试通过视频数据预测物理交互与物体运动。
边缘算力需求将迎爆发,分布式计算重塑未来
随着机器人逐步“逃离工厂”,进入需要实时响应的复杂场景,中心化云计算的延迟问题日益凸显。边缘计算因此成为关键支撑,报告指出未来边缘算力将呈现两大发展趋势:
- 专用边缘芯片的普及:英伟达Jetson Thor是当前典型代表,支持低功耗下的高算力操作,广泛应用于机器人实时决策与避障。
- 分布式推理网络的兴起:特斯拉提出“机器人即算力节点”设想,若部署1亿台具备2500 TFLOPS算力的机器人,在50%利用率下,可提供相当于700万颗NVIDIA B200芯片的算力总量,极大降低对传统数据中心的依赖。
根据摩根士丹利预测,到2030年全球边缘计算需求将显著增长。而到2050年,全球机器人出货量预计将达14亿台,推动边缘AI算力需求达到数百万个B200芯片当量,进一步重塑全球计算资源的布局。