数据成为互联汽车的超级引擎

数字革命为汽车行业带来了深远的影响,也为互联汽车更高效、便捷和安全的驾驶与出行体验创造了无限可能,而眼下这场数字革命正在提速。美国知名调研公司Applied Market Research最新研究报告显示,2019年全球互联汽车市场的价值为630.3亿美元,预计到2027年将达到2251.6亿美元,2020年至2027年的复合年增长率将达到17.1%。

然而,随着带有车道变换及偏离探测功能的高级驾驶辅助系统、高级车辆诊断或预测性维护等高级应用的发展,现有的互联汽车基础设施将不堪重负。这是由于目前汽车内部的电子和线缆基础设施并非为支持复杂的数据处理能力而设计的。考虑到当前互联汽车的成本和复杂性,以及电动汽车设计需要满足的、诸如电池管理系统和环保行程规划等额外需求,增加更多的电线和计算硬件并不可行。此外,在车外环境中,与机器学习生命周期相关的现有数据管理方法比较分散,这也限制了很多新应用在车辆上的大规模部署。

未来,互联汽车将依靠完整的数据生命周期方法,支持企业级的高级分析和机器学习,最终实现全自动驾驶。为了创建一个完全无缝衔接的数据生命周期,从具备将数据传输至云端的速度、带宽、安全性和连接性的服务型网关,到从广泛数据源获取、处理和创建或更新机器学习模型的可扩展式机器学习平台,再到满足数据保真度和模型精确性要求的OTA更新,并将更新后的机器学习模型部署到车辆上,互联汽车生命周期内的所有组成部分都必须无缝集成。为此,新一代基础架构必须具备安全可靠的嵌入式智能边缘操作系统,同时还能支持动态无线更新,以及具备企业级高级分析和机器学习平台等关键功能。

Cloudera与NXP、Wind River、Airbiquity以及Teraki几家行业领导者合作开展了一项名为Fusion的项目,目的是提供从车辆边缘到云端的一体化解决方案,从而解决分散的机器学习数据管理生命周期相关问题。我们希望打造一个实现、并优化未来互联汽车系统的数据生命周期平台,以更快的速度、更高的准确性和更低的成本,训练互联汽车的人工智能和机器学习模型。该项目通过用于数据采集、分析和OTA更新的先进硬件、软件与云数据分析平台,正在持续训练和改进量产车辆的先进应用和自动驾驶功能。

VSI Labs创始人兼总裁、Telematics Research Group 前联合创始人Phil Magney表示:“汽车制造商在复杂技术的实现过程中不断面临新的挑战,例如高级驾驶辅助系统和自动驾驶汽车所需的技术等。新一代数据管理技术栈支持在多个维度持续改进和部署人工智能机器学习模型,因此汽车制造商需要像Fusion项目创建的车辆云端解决方案这样的先进技术,能够将整个汽车生态系统的主流技术都充分利用起来。”

智能车道变更检测是该平台上很多计划应用中的第一个应用案例。之所以被选中,是因为它是实现高级驾驶辅助系统L2/L3功能、并最终实现L4自动驾驶的第一步。下图总结了动态机器学习生命周期。在完全集成的机器学习生命周期内,不断提高互联汽车机器学习算法模型的精确度。

Fusion Project的应用案例表明,互联汽车的机器学习模型精度高达99%以上,数据减少了98%,模型训练时间缩短了10倍。通过更准确的数据收集以及更准确的标签和注释,可以实现模型的精确度,而数据的减少是通过对训练数据进行相关选择,以及对互联汽车传感器数据进行处理和编码来实现的。

Cloudera凭借Cloudera Data Platform 、Cloudera Data Flow(CDF)和Cloudera Machine Learning(CML)技术,为互联汽车机器学习生命周期解决方案提供了技术支撑。其中,CDF是采集互联汽车智能边缘数据、并传输到云端的关键,它能够对海量数据流进行规模化处理和分析,从多个来源获取结构化和非结构化数据,并且能够处理和发挥此类高容量、高速数据的价值,从而解决动态数据挑战。

CML能够创建、更新和管理互联汽车的机器学习模型,支持处理安全快速的机器学习工作流。同时支持在任何地点部署强大、可扩展的人工智能用例,还提供自助式计算、IDE、库和框架并且能够在任何混合云上交付模型。经过持续不断的优化,CML已具备交付模型、预测精度监控、实况调查、模型治理、沿袭追踪以及模型分类功能。

Cloudera制造与汽车业务部总经理Micheal Ger表示:“互联汽车的智能化涉及到硬件和软件的专业知识,因而异常复杂。Cloudera为互联汽车提供了基础数据管理结构,为数据可靠地传输到云端以及大规模的数据存储、处理、分析和机器学习提供了解决方案,这为实时洞察和车载决策打下基础,将推动互联汽车的进一步发展。”