Waymo推出WOD-E2E端到端数据集:聚焦长尾场景的自动驾驶测试新工具

2025-11-18 15:37:42
关注

Waymo推出WOD-E2E端到端数据集:聚焦长尾场景的自动驾驶测试新工具

近年来,自动驾驶技术在高速与部分城市道路的应用中展现出较强的辅助驾驶能力。然而,这项技术尚未实现大规模落地,关键原因在于,自动驾驶的安全性不仅取决于常见场景的处理效果,更在于那些发生概率低但后果严重的极端情况。

设想这样一个场景:在高速公路上行驶时,一只野猪突然从路边冲出,或前方车辆掉落物品。这些场景虽然罕见,却对自动驾驶系统的反应提出了极高要求。

为应对这类挑战,Waymo最近发布了一个名为WOD-E2E(Waymo Open Dataset for End-to-End Driving)的数据集,专门聚焦于长尾驾驶场景,旨在为端到端驾驶研究提供高质量、高逼真的测试资源。

该数据集的价值在于其稀缺性与针对性。它并非简单堆砌普通驾驶片段,而是从数以亿计的实际驾驶数据中筛选出那些罕见但关键的危险场景,帮助研究人员定位系统中最薄弱的环节。

相较于常规数据,WOD-E2E强调在极端条件下模型的行为表现。例如,系统是否能及时刹车、避让或稳定行驶,都是衡量其安全性的核心指标。通过共享此类数据,研究者可以在统一标准下评估不同方法的性能,从而推动端到端驾驶模型从“能运行”迈向“可安全部署”。

WOD-E2E数据集包含哪些内容?

WOD-E2E由4021个20秒长的真实驾驶片段构成,总时长约12小时,聚焦于需立即响应的极端场景。每个片段均配备八个环绕摄像头图像(涵盖前后左右多个视角),采样率为10Hz,并包含车辆的历史轨迹、速度、加速度以及高层路由指令,如直行、左转或右转。

训练集与验证集中还提供了未来五秒的真实轨迹,便于监督训练和性能评估。Waymo将这些片段按场景类型进行了分类,涵盖施工区、复杂路口、行人或骑行人异常交互、多车道竞争、路面异物、特殊车辆交互等,每种类型都对系统的决策能力提出了不同挑战。

WOD-E2E还引入了与人类偏好对齐的Rater Feedback Score(RFS)评价体系。传统轨迹误差指标通常关注模型预测与真实轨迹的距离,但在紧急避险情境中,偏离轨迹反而可能是更安全的选择。

RFS机制通过让模型生成多条候选轨迹,由人工评估员从安全性、合法性、反应时机、刹车必要性等多个维度进行评分,构建参考轨迹集合。模型预测若落在参考轨迹的“信任区域”内则获得相应分数;偏离程度越高,得分越低,但设有最低分保障。

这种评分机制允许存在多种合理决策路径,强调与人类判断的一致性,比单纯的轨迹误差更能体现系统在复杂场景下的可接受性和安全性。

当前主流端到端方法的表现

在端到端自动驾驶研究中,存在多种主流方法,每种在处理长尾场景时各有侧重。

  • 基于鸟瞰图(BEV)的感知与规划方法在空间一致性与全局路径规划方面表现突出,适用于复杂路口和多车道决策。
  • 利用多模态输入并通过大语言模型(MLLM)进行推理的方法,更擅长应对语义复杂或前所未见的场景。
  • 生成式或扩散模型则在轨迹多样性方面表现优异,可提供多个可行路径供后端评估。

研究表明,通过在WOD-E2E上进行针对性微调、扩展环绕输入或在推理过程中使用多样本采样,可显著提升RFS得分。此外,将RFS作为强化学习的奖励信号,有助于引导模型更贴近人类偏好。

WOD-E2E对自动驾驶技术发展的推动

WOD-E2E为自动驾驶研究提供了一个更贴近现实挑战的基准,有助于设计出更具针对性的算法。它鼓励研究人员在模型训练、损失函数设计以及不确定性建模等方面进行创新。

对工程团队而言,该数据集可以作为产品安全性的“加固工具”。开发流程中,可以先利用大规模常规数据训练模型的基础能力,再通过WOD-E2E进行微调和压力测试,结合传统误差指标与RFS等人类对齐评价体系,以确保系统在日常场景中表现稳定,同时在关键情况下具备更优的决策能力。

需要注意的是,WOD-E2E应与其他数据源结合使用。合理的数据增强和情境合成可以增强小样本数据的利用率,但必须保持视觉与动力学的真实性。

若目标是提升语义推理能力,可尝试将视觉与状态信息转化为结构化指令输入至MLLM;若更关注实时性和空间一致性,基于BEV的端到端方法仍是可靠选择;如需提供多种轨迹以供风险评估,则生成式或扩散模型更具优势。将RFS融入训练目标(如作为强化学习奖励或辅助监督信号)将比单纯优化ADE(平均轨迹误差)更能提升模型在长尾场景下的鲁棒性。

结语

WOD-E2E的价值不仅在于其内容本身,更在于它将“长尾问题”与“人类偏好对齐”评估纳入端到端驾驶研究的核心议题。它为学术界和产业界提供了一个在极端条件下验证技术成果的平台,也有助于工程团队在部署前对模型进行更全面的加固。

解决好这些问题,是推动自动驾驶从实验原型迈向可信赖产品的关键一步。

编者语:本文参考报告:《WOD-E2E: Waymo Open Dataset for End-to-End Driving in Challenging Long-tail Scenarios》

-- END --

       原文标题:Waymo最新发布的WOD-E2E端到端数据集能做些啥?

您觉得本篇内容如何
评分

相关产品

OMEGA Engineering 欧米茄 DRC-8900 温度信号调节器

模型可用于多种不同的输入类型,包括热电偶、电阻式温度检测器和过程电压或电流。所有模型都进行了隔离和线性化。热电偶输入模型也有冷端补偿。这些信号调节器有输入到输出、输入到电源和输出到电源的三路隔离。

Conax 康纳斯 Conax Termination – Terminal Barrel with Lead Wire for Thermocouples (T4) 热电偶温度探头

,*标准冷端引线长度为24″。可根据要求提供更长的潜在客户。以英尺为单位指定,例如T4(3FT)。*端子筒体比护套大,卷边到护套上,并填充密封化合物以防止水分渗透。筒体直径尺寸:0.040″到0.187″护套直径– 0.312″,0.250″护套直径– 0.375″,0.375″护套直径– 0.500″。*T4(HT)高温模型使用高温绝缘化合物来达到900°F(480°C)的工作温度上限。

Acoustics First Corporation Model F 隔音和隔音材料

艺术扩散模型F是一个专利,二维,二进制阵列扩散。艺术扩散器的范围通过其独特的角端盖扩展到其他设计,以进一步控制4千赫以上的镜面反射。

Spectro Scientific / AMETEK 斯派超 InfraCal 2 TRANS-SP 水包油监测仪

由于提取液被沉积到一个10毫米的带有聚四氟乙烯塞的石英试管中,轻端挥发性成分被保留用于测量。精确到0.1 ppm。、InfraCal 2 TRANS-SP,最新的介绍我们的易于使用的分析程序,使用相同的测量技术与原始CVH InfraCal模型,增加了诸如数据存储和传输特性,多个仪器校准和密码保护设置。

TSI Incorporated 5310-5 流量计

量程:0到± 300 Std L\/min精度:读数的2%校准:CO2包括标准附件套件,TSI质量流量万用表5310-5提供双向流量测量,在宽流量范围内读数精度为2%。除了累加器,这些模型还可以通过使用流量或压力触发器进行精确的体积测量。5310型号还包括一个内置的数据记录器,可以将同步测量数据直接保存到流量计中。5000系列流量计还包括可配置管端适配器、触摸屏控制和多种安装选项。无论是在实验室、制造或服务环境中测量气体流量,5000系列流量计都能适应您独特的应用。

西门子 6AV6371-1DQ10-0CX0 触摸屏

其设计初衷在于解决传统工业监控系统中“数据孤岛”与“决策滞后”的痛点,通过集成实时数据采集、历史追溯、可视化分析及系统扩展能力,为企业提供从生产执行到战略决策的全链条支持。应用展示层:提供Web HMI、移动端APP及VR虚拟监控界面,支持多终端协同操作。 2. 关键技术突破 边缘计算集成:内置轻量级AI模型,可在本地完成设备预测性维护分析,减少云端依赖。

评论

您需要登录才可以回复|注册

提交评论

提取码
复制提取码
点击跳转至百度网盘