10月24日,以“从预见,到不止遇见”为主题的第四届“1024小鹏汽车科技日”如期而至,在智能驾驶、智能交互、智能机器人及飞行汽车四大维度,分享了小鹏汽车在未来出行领域的探索进程以及量产推进计划。
智能驾驶方面,小鹏汽车不仅分享了行业首个量产落地的城市高等级辅助驾驶功能“城市NGP”的技术思考,并基于全新一代XNGP智能驾驶辅助系统,展示其在软件架构、AI及数据体系方面的竞争优势,保持在智能驾驶下半场的持续领先。
智能交互方面,全新一代的语音架构及基础语音能力自研让小鹏语音的体验进一步加强,在全场景语音2.0的强大功能加持下,打造行业首个全车全时的语音交互系统,并通过智能场景功能,让用户“自定义自己的智能汽车”变成可能。
在智能机器人及飞行汽车领域,小鹏分享了技术演进的最新思考与成果,智能机器人与飞行汽车都有了全新一代的造型及功能设计,飞行汽车已完成试验样机的首次试飞。
9月17日起,城市NGP智能导航辅助驾驶开始在广州试点,陆续推送给P5用户,全栈自研的小鹏汽车成为首个让高阶智能辅助驾驶在城市场景中量产落地的汽车品牌。
小鹏汽车自动驾驶副总裁吴新宙博士首先再次强调了城市场景对智能驾驶发展的意义。数据表明,用户的总用车里程中,城市道路占比高达 71%,换成用车时长维度则可以占到90%。同时,每天仅有25%的用户出行会通过高速,而城市道路则是100%。
因此,城市场景不仅是用户的高频场景,也是刚需。为此,小鹏汽车的城市NGP及LCC增强版采用全新技术架构,包括定位、感知、预测、规控等方面能力全面提升。相比高速NGP,城市NGP的代码量提升至6倍,感知模型数量提升至4倍,预测/规划/控制相关代码量提升至88倍。
但再难也要做,城市场景的落地,只是智能辅助驾驶下半场的开局,小鹏G9搭载的XNGP智能辅助驾驶系统,具备全场景智能辅助驾驶能力,是实现无人驾驶前,辅助驾驶的终极技术形态。
它不仅无需高精地图,全国各个城市和路段都能用,同时可覆盖日常通勤,无缝连接高速、城市、地下停车场等各种场景,体验不中断。在高速、城快接近零接管,安全性、道路博弈能力和通行效率上,XNGP的体验也将超过大部分司机。
为了实现这一能力,小鹏汽车大幅升级硬件,采用508 TOP算力+双激光雷达+800W像素高清摄像头,并应用能力再次提升的软件架构以及全闭环、自成长的AI和数据体系。
其中,XNet 深度视觉神经网络将多个摄像头采集的数据,进行多帧时序前融合,输出BEV视角下的动态目标物的4D信息(如车辆,二轮车等的大小、距离、位置及速度、行为预测等),以及静态目标物的3D信息(如车道线和马路边缘的位置)。
XNet和小鹏汽车的第一代视觉感知架构相比,利用神经网络替代了繁复的手写逻辑,实现了端到端数据驱动算法迭代。当然,出色技术的背后,是庞大的数据采集、标注、训练和间距的部署工作。以50万段训练数据Clip,10亿个物体为例,采用全人工标注需2000人年,以2400TFLOPS算力的服务器进行单机训练需276天。
同时,若将其不经优化的部署至车端,仅此单一网络就可占用单个Orin-X算力的122%。因此,小鹏汽车打造全自动标注系统,标注效率是人工标注的45000倍,即XNet所需2000人年的标注量,现在仅需16.7天即可完成。
此外,小鹏汽车在乌兰察布建成中国最大的自动驾驶智算中心“扶摇”,基于阿里云智能计算平台,算力可达600PFLOPS(每秒浮点运算60亿亿次)。在“扶摇”的加持下,自动驾驶模型训练效率提升602倍。
与2400TOPS算力的服务器进行单机训练相比,80机并行训练可将训练时长由276天缩短至11小时。同时,自城市NGP研发积累的极致工程化能力,让动态XNet 所需的122%的Orin-X 算力,优化后仅需 9%。极致的工程部署能力,是 XNet 上线的关键,更是未来持续迭代的关键。
在软硬件体系带来的高效率下,XNGP系统将在2023年上半年之前,除G9 Max版本车型交付即有高速NGP、记忆泊车、LCC、智能泊车等功能外,在全国范围(所有无图城市)开放识别红绿灯并直行通过路口能力,城市NGP覆盖广州、深圳、上海三座城市。
2023年下半年,大在部分无图城市开放变道、超车、左右转能力(部分高等级能力可用范围将根据用户数量和测试进度分阶段开放),2024年完成全场景打通,实现从车位到车位的智能导航辅助驾驶能力。
此外,针对XPILOT版本的用户,小鹏的智能辅助驾驶能力也将持续更新。2022年起至2023年上半年,小鹏G9 Pro版在交付即有高速NGP、记忆泊车、LCC、智能泊车等功能基础上,开放红绿灯识别、车道级导航功能,该功能在小鹏P5 P版、E版,小鹏P7 E版、智尊版也将开放,小鹏P5 P版的城市NGP将新增开放城市深圳、上海,城市NGP与LCC增强版性能也将进一步提升。
2023年下半年,小鹏G9 Pro版的高速 NGP、VPA、LCC 将迎性能提升,以上所有版本车型的高速NGP功能也将在该周期内迎来在限速调节、脱手检测方面的策略优化。(注:城市NGP城市开放进度以OTA计划为准,部分功能升级需具备相应软件及服务)
在2020年的1024上,小鹏汽车行业首创“全场景语音”功能技惊四座,成为行业首个全语音交互系统。2年过去,小鹏带来行业首个全车全时的语音交互功能——全场景语音2.0。
它首次将MIMO多音区技术应用在车载语音系统,实现小P全程待命,车内多位乘员无需唤醒,多人同时人车语音对话;G9还高效利用本地算力实现了本地对话,在弱网、无网条件下也可稳定控制600多项车辆功能;此外,依托完善的语音端云一体化方案,G9的语音响应速度达到毫秒级,更贴近人性化沟通,说到即做到。
为了实现这一点,小鹏汽车不仅升级了语音交互自研技术架构,拥有功能领先、架构灵活、性能提升等特点,并可解决半自研内外对接复杂、周期长、进度和关键技术风险不可控等研发和项目风险,并进一步提高隐私安全级别,保障用户利益。
该技术架构可以实现全车多路语音流并行处理,支持处理四音区并发、端云一体、实时流式识别理解、并行指令等各种功能交织的语音交互请求;并可全车多路上下文理解,同时既维护单人的对话和上下文管理,也兼容多人的对话和上下文理解。
全时多路拒识在噪声请求量数倍于单路拒识噪声量的情况下,仍能保证准确率不下降,并解决多发声通道、四路语音交互之间的回复冲突,让用户都能实现语音交互时也有较好的反馈。
除此以外,小鹏汽车也作为行业首家自研语音基础能力的车企,包含声学信号处理、本地语音识别、在线语音识别及语音唤醒等方面。这将帮助小鹏解决新一代系统下,对信号处理的更高要求,解决更高复杂度的语音问题,使性能指标大幅提升,如回声消除最多可支持30dB,识别准确率高达97%,错误率相比非基础能力自研,标准安静场景降低7.7%、中英文混合场景降低7.16%、噪声环境场景降低36.79%、带地域口音场景降低33.84%。
同时,自研语音基础能力也让语音的CPU使用率降低65.9%,内存使用降低42.3%,优化工程能力的同时实现快速迭代、用户隐私安全保障,降低数据成本。
未来,小鹏汽车的语音能力还将向着更接近人人交互的方向进化:让语音助手可听音、察言、观色,实现无拘无束的轻松交流;可理解、学习、推理、记忆,做更懂用户的鹏友;可感知、共情、表达,成为陪伴用户全场景的可靠伙伴。
在自动驾驶和智能语音两大领域的突破之外,小鹏汽车科技日还公布了企业在诸多领域的进展。
首先是智能场景,这是小鹏智能座舱的全新自定义能力。具体而言,远程智能场景,用户不在车上时,车辆依然可根据自身感知能力,继续执行用户定义的场景;多个场景之间,可根据上一个场景的执行结果,并主动判断串联后续场景;普通用户可直接选择自己喜欢的场景,一键开启全程服务,并支持社区、社媒传播和跨车型继承;极客用户更可深度参与共。
小鹏鹏行的智能机器人自2021年首次亮相后,迎来了新一代原型机。相比上一代,现款机型造型更加科幻,拥有未来风格:头部集成了AR投影,是对机器人交互形式的探索;在足底使用与高端跑鞋相同的“EVA超临界发泡”及耐磨橡胶,提供优秀的缓震、静音与耐磨性能;颈部等区域使用新型弹性织物与液态硅胶材料,解决多自由度运动的设计问题,且耐冲击、耐刮擦。
备受关注的飞行汽车也有了突破性的进展。小鹏汇天飞行汽车已完成试验样车的成功首飞,这是全球首个真正的电动垂起飞行汽车。
科技日上,小鹏汇天发布了飞行汽车最新构型,具备机臂折叠收纳系统,可进行陆行和飞行模式的切换。在机臂折叠收纳状态,它的尺寸和常规汽车相当,能够在开放道路自由行驶;可进行陆行和飞行模式的切换。在法规、环境允许的条件下垂直起降,飞行跨越拥堵、障碍、河流等,满足人们短距离低空出行的需求。
相比去年的概念车型,最新设计由横列双旋翼构型优化为分布式多旋翼构型。现方案机臂及桨叶更短,飞行状态总长、总宽更小,对起降场地的尺寸限制更小,飞行的可通过性更好,使用更便捷。同时,取消桨叶折叠、周期变距桨毂,折叠收纳方式更简单。
从预见,到不止遇见,中间的挑战与探索往往是最容易被忽略的部分。定位为“未来出行探索者”的小鹏汽车主动承担起了这一重任,不断探索未来的过程中,也将持续打造技术竞争优势。在举办了四年后,小鹏汽车科技日仿佛一出连续剧,看完这集后,也令人对下一集有了更多的期待。