快消息!为什么说数据驱动才是自动驾驶的未来?

来源:智车科技IV时间:2023-04-18 14:45:08

本文来源:智车科技 

/导读/


(相关资料图)

当下,自动驾驶的落地难度已经远超当时人们的构想,而很多雄心勃勃的L4自动驾驶公司也不得不向现实低头,例如最近的小马智行的技术分享日上,便表露出进军辅助驾驶的未来商业规划,以便取得快速的商业落地及盈利。

而完全的自动驾驶难以实现的原因,最大的一点便是现实世界中的corner case无法被完全解决,一方面由于数据量的问题,自动驾驶公司除了Tesla都无法拿到大量的车主驾驶的行为数据,牵涉到用户隐私及安全;另一方面,也缺少一种数据驱动学习的自动驾驶决策系统,从而实现喂的数据越多,越能够接近人类的驾驶行为风格,甚至超越人类的决策能力,从而提升驾驶的安全。而以上这些都离不开数据驱动,作为自动驾驶未来的希望,数据驱动已经被业界认为是实现自动驾驶的热门方向。而为何数据驱动如此火热,它将为自动驾驶的落地带来怎样的改变呢?

1

何为数据驱动的自动驾驶?

其实数据驱动并非自动驾驶领域创造出的新概念,在软件开发时代就早已有应用。例如我们在使用一些app或者系统时,都会弹出提示框询问我们是否加入用户体验的改进计划,如果加入便会收集我们在使用app时的数据,从而让开发者发现系统可能出现的问题以及用户的偏好以及遇到的问题,从而帮助更好地去迭代系统,不断优化用户体验。在这个过程中,用户的数据就是关键因素,可以帮助工程师更快地去定位问题。

在自动驾驶领域中,数据驱动中的数据包括传感器采集到的数据,从而帮助感知模块优化更新模型,可以认识更多之前未见过的物体;也包括人类驾驶员的驾驶数据,这样配合场景工程师可以提炼出在该种工况下人类司机的决策行为是什么,从而归纳出人类驾驶员的策略普遍性与特征,帮助决策模块去生成更符合人类想法的车辆运动动作。

2

数据驱动将为自动驾驶带来什么?

我们知道,自动驾驶是一个数据密集型的领域,而有效地利用好所采集到的数据可以让自动驾驶的效果提升一个档次。数据驱动的自动驾驶旨在通过大量的数据采集,处理以及分析,让自动驾驶系统能够自主学习和适应各种复杂的驾驶场景。

目前,数据驱动的自动驾驶主要应用在软件算法层面,主要包括了:

1.感知处理:通过数据驱动的方式,让自动驾驶系统能够识别和理解周围的环境,包括道路、车辆、行人、交通标志等。感知处理模块是自动驾驶系统的“眼睛和耳朵”,主要通过传感器采集周围环境的信息,包括道路、车辆、行人、交通标志等,然后通过数据处理和分析,让自动驾驶系统能够识别和理解周围的环境。

2.决策规划:通过数据驱动的方式,让自动驾驶系统能够根据当前的环境和任务,做出最优的决策和规划。决策规划模块是自动驾驶系统的“大脑”,主要根据感知处理模块提供的信息,做出最优的决策和规划,包括路径规划、速度规划、车道规划等。通过数据驱动的方式,让自动驾驶系统能够自主学习和适应各种复杂的驾驶场景,从而实现自动驾驶。

3.控制执行:通过数据驱动的方式,让自动驾驶系统能够实现精准的控制和执行,包括油门、刹车、转向等。控制执行模块是自动驾驶系统的“手和脚”,主要通过执行器控制车辆的油门、刹车、转向等,实现精准的控制和执行。通过数据驱动的方式,让自动驾驶系统能够实现更加精准的控制和执行。

3

如何实现数据驱动的自动驾驶

那么,既然数据驱动是自动驾驶的未来,又将解决目前自动驾驶遇到的各种挑战性难题,那么如何去具体实现呢?各家企业所采用的方法又包括哪些呢?

自动驾驶中的数据驱动实现方法其实有很多,而目前业界主要常见的做法步骤包括:

1.数据采集:自动驾驶系统需要大量的数据来训练和优化算法模型,数据采集可以通过传感器、摄像头、雷达等设备来实现。

2.数据处理:自动驾驶系统需要对采集到的数据进行处理和分析,包括数据清洗、数据标注、数据预处理等,以便更好地训练和优化算法模型。

3.算法模型:自动驾驶系统的算法模型是数据驱动的,需要通过大量的数据来训练和优化,以便更好地实现感知处理、决策规划和控制执行等核心模块。

4.数据闭环:自动驾驶系统需要建立一个完整的数据闭环,包括数据采集、数据处理、算法模型训练和优化、模型部署和测试等环节,以便不断地优化和改进自动驾驶系统的性能。

通过上述的流程,可以简单地搭建一套数据驱动的自动驾驶系统。而与此同时,各大自动驾驶厂商纷纷推出自己的数据闭环方案。Tesla推出了核心为Autopilot数据引擎框架。获得数据后,先通过单元测试确认模型误差,然后进行数据清洗与标注,最后完成模型训练与部署。目前Tesla已经积累了上百亿英里的行驶数据,这些海量的真实路况数据,既是Tesla核心资产,同时也帮助Tesla实现了模型的快速迭代与升级,为率先抢占高级别的自动驾驶技术高地平添一大助力。而无人驾驶老大哥Waymo引入了数据挖掘、主动学习、自动标注等模块,但基本的框架相差无几。获得数据来源后,通过数据标注获得数据真值,其中涉及到数据筛选、挖掘和主动学习,模型优化完成测试后,进行发布或部署。但相较于Tesla的车队及影子模式,Waymo的数据采集量显然是无法比拟的,在数据为王的自动驾驶时代,可能会落入下风。

而其他的自动驾驶公司也大多模仿了Tesla和Waymo的模式,并会在数据闭环中引入仿真、计算等功能模块,但自动驾驶数据闭环通用基本框架可简化为:数据采集-数据标注-模型训练-部署,如此周而循环往复。

3

数据驱动的未来

现实驾驶场景难以穷尽,极其复杂且不可预测,需要AI模型快速迭代升级。数据驱动作为其中必不可少的一环,将帮助实现自动驾驶数据闭环的快速循环迭代,以满足新场景模型适配问题,同时也需要各“长尾场景”数据的高效流转。

模型训练方面,目前AI算法模型已阶段性基本成熟。在实际应用时,不同场景需要解决的问题不尽相同。这并非算法模型的问题,而是场景适配度的问题。自动驾驶AI模型后续调优主要以数据迭代为主,需要投喂海量新场景数据。

数据采集方面,依靠遍布车身的各类传感器,车辆每小时采集的数据量可达数TB之多。然而采集得到数据为非结构化数据,这些未经处理的数据并不能直接用于模型训练,标注后才能产生使用价值。

横亘在数据与模型训练之间的首要问题是如何大量地采集到这些数据并高效地处理海量数据集,而数据作为自动驾驶时代每家公司的核心资产,必然是核心机密。在未来,又数据量优势的企业必然将实现技术的垄断与降维打击,这也是为何主机厂不肯与L4自动驾驶企业合作的原因。当技术条件成熟时,数据量将成为行业壁垒,到时自动驾驶产业的胜负才将取得分晓。

原文标题 : 为什么说数据驱动才是自动驾驶的未来?

关键词:

图文推荐

热门文字

标签

精彩赏析