智元机器人真机强化学习技术实现工业产线落地
11月3日,智元创新(上海)科技有限公司(简称:智元机器人)宣布,其研发的真机强化学习(Real-World Reinforcement Learning)技术已实现从学术研究到工业应用的跨越。目前,该技术已在与龙旗科技合作的验证产线中成功部署,相关实验数据将在后续部署过程中由第三方验证并公开。
此次落地的真机强化学习技术方案,标志着人工智能训练方法在工业场景中的新进展。该技术使AI算法能够在真实物理设备上进行强化学习训练,而非局限于仿真环境。这意味着机器人可以通过实际操作中的试错机制,逐步掌握最优行为策略。
近年来,强化学习在工业机器人领域展现出巨大潜力,但其从仿真环境走向现实生产仍面临诸多挑战。当前多数研究仍处于实验室阶段,尚未实现大规模工业应用。
根据了解,该技术已在实际产线中实现了自主学习与策略持续优化。新技能的训练和部署时间仅需数十分钟,且在整个运行过程中保持性能稳定。面对产线换型、工艺调整等需求,系统仅需少量硬件调整和标准化流程即可快速响应,大幅提升产线的柔性与部署效率。
智元机器人合伙人兼首席科学家罗剑岚在接受媒体采访时表示,该方案现已进入常态化运行阶段,其关键突破在于实现了AI模型在工厂环境中的实际部署,并达到了100%的执行准确率。在联调机制的支持下,工业产线的故障率已控制在符合验收标准的范围内。
罗剑岚指出,传统自动化设备在面对不确定性场景时,往往难以兼顾高精度、高成功率与通用性。相比之下,真机强化学习技术能够更有效地应对这一挑战。该技术预计将在集中上下料和柔性换线场景中占据约80%的应用比例。
长期以来,精密制造产线受限于刚性结构,传统机械臂依赖复杂的夹具设计和场地改造,调试周期长、换型成本高。“视觉+力控”等柔性技术虽有所改进,但部署复杂、对参数敏感,难以满足消费电子行业快速迭代的需求。
相较之下,真机强化学习技术具备极速部署、超高适配和柔性换型三大核心优势。其训练周期由“数周”缩短至“数十分钟”,效率提升显著。系统可在不同工位和产线间快速迁移和复用,并能自主应对物料位置偏差、尺寸公差等干扰,在长时间运行中持续保持工业级的稳定性与任务完成率。
尽管真机强化学习相较于仿真训练成本较高,但在成本控制方面仍具优势。罗剑岚表示,该技术在显性成本上与产能提升直接挂钩,有助于提高整体生产效率。而在隐性成本方面,系统的模块化和柔性化特性显著降低了工序切换的难度,仅需极小的硬件改动即可实现跨工序部署。
罗剑岚进一步强调,随着经验的积累,该系统在新产线上的部署效率将持续提升,成本也将逐步下降。他表示,这套系统具备可管理、可复制和可拓展的特性,未来计划将其发展为通用模板,推广至更多应用场景,如3C、汽车、家电和医疗等领域,实现类似“搭积木”的模块化部署。