自动驾驶决策系统:功能框架与技术演进
在自动驾驶技术中,决策过程并非单一动作,而是一个层次分明的流程。系统首先在行为层确定目标,如变道、左转或减速跟车,随后在轨迹层将行为转化为具体的安全路径,最终由控制层执行路径跟踪。
设计决策系统时需兼顾多重目标,包括安全性(始终优先)、舒适性(避免晕车)、合法性(遵守交规)、效率性(避免不必要的低速)以及可解释性(便于事后追溯)。这些目标常存在冲突,例如最安全的选择可能牺牲效率,而最快的动作又可能带来风险。因此,系统的核心在于在这些目标之间找到合理平衡。
经典方法:分层决策与优化框架
长期以来,自动驾驶决策系统主要采用“分层+优化/采样”的方法。系统依据地图信息与当前交通状况,制定合理的策略,比如在交叉路口选择“等候再左转”还是“加速通过”,以保障行驶安全。
生成安全轨迹的主流方法包括采样类与优化类。采样类方法通过轨迹库或随机采样生成多个候选路径,根据碰撞风险、舒适度、法规等指标评估,选择最优解。这类方法直观但计算成本高,尤其在复杂场景下。
优化类方法则将轨迹建模为连续函数,通过拉格朗日优化、迭代线性二次调节(iLQR)或模型预测控制(MPC)寻找最优解。其中MPC因其能够整合动力学与约束条件,并采用滚动优化机制响应环境变化,被广泛采用。
符号化规则也被引入以增强安全性。Mobileye提出的Responsibility-Sensitive Safety (RSS) 就是一套数学化的“常识驾驶规则”,用于判断何时应采取防御措施,从而为系统提供白盒式安全保障。
在商用系统中,常设计“安全监管层”作为补充机制。该模块不负责轨迹生成,而是在主控模块出现潜在风险时进行干预或修正。近年来,学习模型与基于规则的安全模块的结合,逐渐形成“学习+可证明安全”的混合架构。
新兴趋势:联合建模与不确定性处理
当前行业趋势之一是模糊预测与规划之间的界限,将世界建模、多主体行为预测与轨迹生成进行紧密融合,甚至将规划整合进统一的学习框架。
Transformer架构因其在时序与交互建模方面的优势被广泛采用,如MTR与AgentFormer等系统展示了其在多主体、长时序轨迹预测中的卓越表现。自注意力机制使模型能捕捉交通参与者间的交互关系,生成更具多样性的未来轨迹。
扩散模型正被用于轨迹预测与生成任务。这类模型擅长从复杂分布中生成多样化的样本,有效表达未来的不确定性,生成的轨迹模式通常优于传统高斯混合模型。
另一个方向是采用BEV(Bird’s Eye View,俯视视角)表示方式。该方法将传感器数据(如相机、雷达、激光)投影为俯视图,使空间结构显式化,便于后续模块在统一空间内进行轨迹评估与优化。
此外,大型多模态模型也受到关注。一些企业尝试将视觉、点云、地图和语言信息整合到统一的神经网络中,以增强系统理解与推理能力。例如,Waymo与Google正探索将大模型应用于世界建模与轨迹生成。
这些趋势的共性在于更强调“联合建模”和“不确定性建模”。传统系统采用分层优化,信息在层间压缩传递。新方法则倾向于在端到端或半端到端框架中联合训练,以减少信息损失,并通过概率建模保留不确定性,使规划在面对多种未来可能时更稳健。
工程挑战:安全性、实时性与合规
尽管技术进步显著,决策系统在实际部署中仍面临诸多挑战。安全性与可验证性是关键问题,尤其是端到端学习模型因其“黑盒”特性,在极端场景下可能行为不可预测。
为此,系统中常保留可解释与可验证的模块,或通过学习模块外加安全层进行保障。例如,将实时MPC与控制屏障函数(CBF)结合,可在城市驾驶中提供可证明的安全性。
实时性与计算资源限制同样重要。扩散模型、大型Transformer与多模态模型对计算资源需求较高,而车载计算平台在功耗、延迟方面存在硬性限制。因此,通常采用混合策略,在边缘设备上部署轻量化模块进行快速响应,在云端使用大模型进行策略更新与训练。
边缘场景处理也是关键挑战之一。现实交通中,低概率高风险事件虽少,但必须具备有效应对机制。解决方案包括生成模拟数据、使用对抗训练与基于规则的安全边界等。
此外,自动驾驶系统的责任归属与伦理问题仍存争议。为增强公众信任,系统需具备透明性与可追溯性,如决策日志记录与解释性接口,以支持事后分析与法律审查。