来源:spectrum.ieee.org
作者:刘少山/JEAN-LUC GAUDIOT
图源:刘少山
在过去的20年里,人们做出了巨大的努力,以创造一种能够使用传感器和人工智能来模拟环境并规划安全驾驶路径的汽车。
然而,即便是今天,这项技术也只在校园等地区运行良好,这些地区需要绘制的道路有限,交通量也很少。也就是说,它仍然无法管理繁忙、不熟悉或不可预测的道路。
至少就目前而言,汽车所能提供的感知能力和智能是有限的。
为了解决这个问题,我们必须进行思维转换——把更多的智能放到基础设施中,让道路变得智能。
“智能道路”的概念并不新鲜。根据传感器数据自动调整时间的交通灯和自动调整亮度以减少能耗的路灯都包含在内。
让-吕克·高迪奥(Jean-Luc Gaudiot)是美国加利福尼亚大学尔湾分校亨利·萨缪里工程学院的教授。本文的另一位共同作者刘少山是普思英察(PerceptIn)公司的创始人和首席执行官,在北京的测试道路上证明了路灯控制可以使交通效率提高40%。
与路灯之类的零星变化相比,本文希望介绍一个更加雄心勃勃的方法,将智能道路和智能车辆结合起来,形成一个综合的、完全智能的交通系统。
综合信息的数量和准确性,将使这样一个系统的安全性和效率达到前所未有的水平。
人类司机的交通事故发生率为2.6起/100万km;自动驾驶汽车必须做得更好,才能获得认可。然而,一些角落或盲点同时困扰着人类司机和自动驾驶汽车,目前没有办法在没有智能基础设施的帮助下处理这些问题。
将大量的智能特性放到基础设施中,也会降低自动驾驶汽车的成本。
一辆完全自动驾驶汽车的建造成本仍然相当高,但随着基础设施变得更加强大,将有可能逐步把更多的计算工作量从车辆上转移到道路上。最终,自动驾驶车辆将只需要配备基本的感知和控制能力。估计这种转移将使自动驾驶汽车的成本降低一半以上。
它的工作原理是这样的,如上图所示。
这是北京的一个周日早晨,沙尘暴将天空变成黄色。你在城市里开车,和路上的其他司机一样,都没有清晰的视角。但是每辆车在行驶过程中都能分辨出拼图的一部分。
这些信息,结合来自嵌入道路/附近传感器和来自气象服务中继的数据,被输入一个分布式计算系统,该系统使用人工智能来构建一个单一的环境模型,可以识别道路上的静态物体以及沿着每辆车的预测路径移动的物体。
适当地扩展,这种方法可以预防大多数事故和交通堵塞,这些问题自汽车问世以来一直困扰着公路运输。
到目前为止,我们已经在中国的几个城市以及我们在北京的测试道路上部署了这个系统的模型。
例如,在上海以西1100万人口的城市苏州,部署在一条单向有三条车道的公共道路上,项目的第一阶段覆盖了15km的公路。道路上每隔150米就部署一个路边系统,每个路边系统包括一个配备英特尔CPU和Nvidia 1080Ti GPU,一系列传感器(激光雷达、照相机、雷达),以及一个名为RSU(路边单元)的通信组件。这是因为激光雷达与摄像头相比,能提供更准确的感知,尤其是在夜间。然后RSU与部署的车辆直接通信,以促进路边数据和车辆上的车边数据的融合。
路边的传感器和继电器构成了合作式自动驾驶系统的一半,而车辆本身的硬件则构成了另一半。
在一个典型的部署中,我们的模型采用了20辆车。每辆车都有一个计算系统,一套传感器,一个发动机控制单元(ECU),以及连接这些组件的控制器区域网络(CAN)总线。
道路基础设施,如上所述,由类似但更先进的设备组成。路边系统的高端Nvidia GPU通过RSU进行无线通信,而它在汽车上的对应物被称为车载单元(OBU)。这种来回的通信促进了路边数据和汽车数据的融合。
基础设施收集当地环境的数据,并立即与汽车分享,从而消除盲点,并以其他明显的方式扩展感知。基础设施还处理来自自身传感器和汽车上传感器的数据,以提取其含义,产生所谓的语义数据。
例如,语义数据可以将一个物体识别为行人,并在地图上定位该行人。然后,结果被发送到云端,在那里,更复杂的处理将语义数据与来自其他来源的数据融合在一起,以产生全球感知和规划信息。然后云端向汽车发送全球交通信息、导航计划和控制命令。
在我们的测试道路上,每辆汽车都以自动驾驶模式开始——目前最好的系统能够管理的自主水平。
每辆车都配备了6个毫米波雷达用于探测和跟踪物体,8个摄像头用于二维感知,1个激光雷达用于三维感知,以及GPS和惯性导航用于在数字地图上定位车辆。二维和三维感知结果以及雷达输出被融合,以生成道路及其周边环境的综合视图。
接下来,这些感知结果被送入一个模块,该模块跟踪每个检测到的物体,例如汽车、自行车或滚动的轮胎,然后画出一个轨迹,该轨迹可被送入下一个模块,这个模块预测目标物体将去哪里。
最后,这种预测被移交给规划和控制模块,由它们来引导自主车辆。该车创建了一个高达70米的周边环境模型。所有这些计算都在汽车内部进行。
同时,智能基础设施也在做同样的工作,用雷达进行探测和跟踪,用相机进行二维建模,用激光雷达进行三维建模,最后将这些数据融合到自己的模型中,以补充每辆汽车正在做的事情。
由于基础设施是分散的,它可以对250m以外的世界进行建模。然后,汽车上的跟踪和预测模块将把较宽的模型和较窄的模型合并成一个综合视图。
汽车上的装置与路边的对应装置进行通信,以促进车内数据的融合。这种无线标准被称为C-V2X(Vehicle to Everything),与电话中使用的标准并无不同;通信距离最远可达300米,而延迟(信息传递的时间)约为25毫秒。此时,汽车的许多盲点被基础设施上的系统所覆盖。
C-V2X可使用LTE标准(4G)和5G标准的商业移动网络。
LTE-V2X专门用于道路和汽车之间300米范围内的直接通信。虽然通信时延只有25毫秒,但它搭配的带宽很低,目前约为100KB/s。
相比之下,商用4G和5G网络具有更大的覆盖范围和明显更高的带宽(下行为100MB/s,上行为50MB/s)。然而,它们传输过程中有较大时延,这对自动驾驶中的实时决策构成了重大挑战。
请注意,当车辆以50km/h的速度行驶时,如果道路干燥,车辆的制动距离为35m;而道路湿滑时,制动距离为41m。因此,基础设施所允许的250m的感知范围为车辆提供了很大的安全余地。
在我们的测试道路上,当基础设施的智能开启时,脱离率(安全驾驶员必须接手)至少降低了90%,这样它就可以增强自动驾驶汽车的车载系统。
在我们的测试轨道上进行的实验告诉我们两件事。
首先,由于交通状况在一天中不断变化,基础设施的计算单元在高峰期完全处于驾驭状态,但在非高峰期则基本处于闲置状态。这与其说是一个错误,不如说是一个特点,因为它将巨大的路边计算能力释放出来,用于其他任务,如优化系统。
其次,我们确实可以优化系统,因为不断增长的本地感知数据库可以用来微调我们的深度学习模型以提高感知能力。通过把闲置的计算能力和感官数据的档案放在一起,我们已经能够在不给云端带来任何额外负担的情况下提高性能。
要让人们同意构建一个庞大的系统是很难的,因为它所承诺的好处只有在它完成之后才会出现。为了解决这个鸡生蛋蛋生鸡的问题,我们必须通过三个连续的阶段进行。
第一阶段:基础设施增强型自动驾驶,车辆将车侧感知数据与路侧感知数据融合,以提高自动驾驶的安全性。车辆仍将大量装载自动驾驶设备。
第二阶段:基础设施引导的自动驾驶,在这个阶段,车辆可以将所有的感知任务卸载到基础设施,以减少每辆车的部署成本。出于安全考虑,基本的感知能力将保留在自主车辆上,以应对与基础设施的通信中断或基础设施本身出现故障。与第一阶段相比,车辆需要的传感和处理硬件将明显减少。
第三阶段:基础设施规划的自动驾驶,其中基础设施负责感知和规划,从而实现最大的安全性、交通效率和成本节约。在这个阶段,车辆只配备了非常基本的传感和计算能力。
技术挑战确实存在。
首先是网络的稳定性。在车辆高速行驶时,融合车辆侧和基础设施侧数据的过程对网络波动极为敏感。使用商业4G和5G网络,我们已经观察到网络不稳定的范围从3到100毫秒,足以影响基础设施帮助汽车。
还有更为关键的是安全性。我们需要确保黑客不能攻击通信网络,甚至基础设施本身,将不正确的信息传递给汽车,从而造成潜在的致命后果。
另一个问题是如何获得对任何形式的自动驾驶的广泛支持,更不用说基于智能道路的自动驾驶了。
在中国,74%的受访者赞成快速引入自动驾驶,而在其他国家,公众的支持则比较犹豫。只有33%的德国人和31%的美国人支持快速扩展自动驾驶汽车。也许这两个国家完善的汽车文化使人们更加重视人的驾驶体验。
然后是管辖权冲突的问题。
例如,在美国,道路的权力分布在联邦公路管理局和州及地方政府之间,前者负责运营州际公路,后者负责管理其他道路。并不总是清楚哪一级政府负责授权、管理和为现有基础设施升级为智能道路付费。近来,在美国发生的许多交通创新都发生在地方一级。
相比之下,中国已经制定了一套新的措施来支持智能道路基础设施的关键技术的研究和开发。
中国交通运输部公布的一份政策文件,提出到2025年,自动驾驶基础理论研究取得积极进展,道路基础设施智能化、车路协同等关键技术及产品研发和测试验证取得重要突破。
汽车制造商、科技公司和电信服务提供商之间的合作已经在北京、上海等地催生了自动驾驶初创企业。
车路协同有望比严格意义上的纯车辆自动驾驶方法更安全、更高效、更经济。该技术已经存在,并且正在中国实施。我们很快就会看到这两种截然不同的自动驾驶方法在世界交通市场上展开竞争。