记者从清华大学车辆与运载学院杨殿阁教授团队了解到,团队在自动驾驶研究中取得关键技术突破,发明了一种自动驾驶“可信持续进化”技术,帮助自动驾驶汽车实现在任何场景下,即使没有预先设定的应对方案,也能自主学习应对该场景并保证行驶安全。近日,该成果以“利用动态置信度强化学习实现自动驾驶的持续提升”为题,发表在《自然·机器智能》上。
文章通讯作者杨殿阁介绍,该技术会在自动驾驶汽车行驶初期将所有场景无差别地看成未知场景,设计主动避让的基础驾驶策略以保证安全性;在此基础上,AI模型将从大数据中主动寻找熟悉的行驶场景,并自主地将在这些场景中的驾驶性能从基础策略调整到更优水平,因而能从系统设计的角度,解决长尾场景难以穷尽的问题,保证在任意场景下不依赖预先设定的“可信持续进化”。
论文第一作者、清华大学车辆与运载学院博士后曹重表示,实现这样一个技术最核心的难点在于进化的过程要保证性能是单调提升的,这样才能使得整个进化过程仍具备最基础的安全性,但经典的AI训练过程中性能通常存在震荡现象,可能会引发新的安全风险,而研究团队设计的通过动态评估置信度进行AI模型训练的方案,能够使性能随数据的增加而单调持续提升,因而能够很好地满足这一要求。
研究团队在仿真和实车测试过程中对该技术进行了验证。实验结果表明,在车辆逆行、工程车辆压线超车等众多系统没有预先设定的突发场景中,该技术都能够保证汽车的自动驾驶安全性,同时随着车辆的运行和数据的持续采集,驾驶性能能够自主进化,得到进一步提升。杨殿阁说,这一技术突破有望推动无人驾驶从典型场景示范走向开放道路实际应用,让无人驾驶汽车具备实现普及和大规模商用的可能性。
据了解,研究团队正在与国内外领军汽车企业和知名的出行厂商合作开展商业化合作,进一步开展大规模无人驾驶开放道路应用示范,以检验该技术在更多行驶场景中的应对能力与自主提升能力,并持续收集无人驾驶测试数据,以满足开放道路无人驾驶可信赖性要求。