自動駕駛汽車依然面臨一個尷尬的問題:
號稱自動駕駛,這些汽車到底什么時候不用人類駕駛?
這個問題的最終解釋權在道路交通管理部門。
放下各種法律法規(guī)不談,汽車和科技巨頭們在技術端依然沒能實現(xiàn)全自動駕駛。
因此,除了在公路上持續(xù)測試,自動駕駛公司還求助于模擬,試圖在虛擬環(huán)境中試遍各種情況,將現(xiàn)實世界中不常出現(xiàn)的變量也一一化解。
通常來說,我們通過考試,就能拿到駕照通行全國。但換到自動駕駛汽車上,這一套就行不通了。
這些車輛的獲得相關能力時需要「因城施策」,而且必須進行更為詳盡的場景測試,甚至精確到某個十字路口。
為了進入這個價值 7 萬億美元的超級市場,業(yè)內(nèi)各家公司在測試上卯足力氣,以便贏得公眾和監(jiān)管者的信任,而模擬測試顯然是他們證明自己的最佳展示平臺。
汽車之心(微信 ID:Auto-bit)以模擬為切入點,整理總結(jié)了來自包括汽車廠商、科技巨頭、新創(chuàng)企業(yè)在內(nèi)的公司專家的觀點。
這些業(yè)內(nèi)頂級的專家正花費巨額資金回答一個問題,即我們到底該測試些什么?
圖 1:模擬與現(xiàn)實中的十字路口
1、沒有模擬,就沒有自動駕駛汽車
拿通用自動駕駛團隊 Cruise 來說,Cruise 的虛擬測試車每天要在模擬器中運行 20 萬個小時。
至于公認的行業(yè)領頭羊 Waymo,在模擬器里已經(jīng)累積了超過 100 億英里的測試里程。
自動駕駛汽車在模擬場景中訓練圖片來自51VR自動駕駛仿真平臺
對自動駕駛公司來說,尤其是訓練神經(jīng)網(wǎng)絡時,模擬器的重要性越來越強了。
為什么放著現(xiàn)實世界的數(shù)據(jù)不用而求助于模擬?原因有三:
1. 在現(xiàn)實世界采集數(shù)據(jù)是有危險的;
實車測試無法滿足自動駕駛的測試里程要求和場景覆蓋度要求。模擬是保障自動駕駛汽車安全不可或缺的測試手段。
行業(yè)內(nèi)專家學者認為,驗證自動駕駛汽車的安全性需經(jīng)過上億公里的測試里程積累,如蘭德公司認為自動駕駛需要幾億公里的里程測試數(shù)據(jù)來確保安全性,寶馬認為自動駕駛研發(fā)至少需要達到 2.5 億公里的測試。
2. 許多假設和反事實情況在現(xiàn)實中是無法企及的;
與實車測試相比,仿真模擬測試可以在短時間內(nèi)對罕見案例進行多次復現(xiàn),加速自動駕駛汽車的生產(chǎn)周期,節(jié)約研發(fā)成本,積累測試里程。
3. 采集更為豐富數(shù)據(jù)的要求。
這是因為現(xiàn)實世界中數(shù)據(jù)采集的速度有限。
可以這么說,現(xiàn)在沒有哪家自動駕駛公司不用模擬器。
對測試軟件來說,模擬器是絕對的殺手級工具,在某些情況下它還能訓練神經(jīng)網(wǎng)絡。
自動駕駛技術不過關,后果可能是車毀人亡
那么,這些公司是如何利用自動駕駛模擬測試反哺到真實的場景中去的?
與 Waymo 類似,Zoox 也有「無保護左轉(zhuǎn)困難」的煩惱。
于是,Zoox 團隊開發(fā)了一個人工左轉(zhuǎn)信號燈,然后灌入模擬環(huán)境。
Zoox 聯(lián)合創(chuàng)始人 Jesse Levinson 透露稱,不久之后 Zoox 的自動駕駛系統(tǒng)識別起現(xiàn)實世界的左轉(zhuǎn)信號燈就順暢多了。
今年早些時候,Lyft 注意到自己的測試車一旦被其他車加塞,就會急剎車。
于是,Lyft 的工程師將這一場景放入模擬器。據(jù) Lyft 自動駕駛負責人 Luc Vincent 介紹,這樣的方法不但速度快,成本低,自動駕駛系統(tǒng)「一驚一乍」的毛病也得到了改善。
Aurora 也非常依賴模擬,通過記錄人類駕駛員的駕駛習慣,然后在模擬器中與自動駕駛系統(tǒng)進行對比。
Aurora 聯(lián)合創(chuàng)始人 Sterling Anderson 說,在路測前會專門提醒司機,必須像專業(yè)司機那樣去駕駛。
與其他公司一樣,特斯拉也不敢輕視模擬器。特斯拉 CEO Elon Musk 表示,「世界太復雜,說不清什么時候就會有極端情況登門造訪?!?
好消息是,模擬器里場景幾乎是無限的。但大多數(shù)公司并不愿透露自己到底測試了多少場景。
安波福是個特例,據(jù)汽車之心了解,安波福已經(jīng)在模擬器中構(gòu)建了超過 4 萬個場景。
有行業(yè)人士表示,想要實現(xiàn) 100% 的完美是不可能的。但在讓自動駕駛系統(tǒng)更安全的過程中,我們得保證一切安全可靠。
模擬也有短板
既然自動駕駛模擬測試可以反哺到真實場景中去,那么模擬能替代現(xiàn)實世界中大規(guī)模的數(shù)據(jù)采集工作嗎?
答案是:不能。
原因在于,模擬無法擁有與現(xiàn)實世界相同的經(jīng)驗知識,而其中一些經(jīng)驗知識對駕駛來說又必不可少。
舉例來說,模擬器中沒有其他道路參與者如:車輛、行人與自行車等行為習慣的經(jīng)驗知識。
這個問題可以分為兩部分:
行為預測:在道路參與者做出下一步動作前預知他們的行為。
溝通與互動:了解道路參與者對自動駕駛汽車的行為會作何反應,同時知曉該如何做出相應反應,以實現(xiàn)雙贏的結(jié)果。
人類的行為表現(xiàn)是一個經(jīng)驗問題,需要經(jīng)驗數(shù)據(jù)來解答。
也就是說,類似游戲中那樣簡單化的人類行為模型,對付一些有限的駕駛環(huán)境還行,但隨著場景變得更密集,城市擁擠、混亂、復雜、交互等一系列條件疊加時,為人類行為建模的難度會幾何級增長,簡化模型的預測能力也會直線下降。
而自動駕駛汽車需要精確的經(jīng)驗現(xiàn)象模型。
舉例來說,如果一輛自動駕駛汽車在路口左轉(zhuǎn),面對迎面駛來的車輛,它必須判斷到底對方會不會減速?減多少速?
這類知識從紙上談兵般的分析中得不出來,這完全是經(jīng)驗。
這也是為什么馭勢科技的一位工程師向汽車之心解釋:模擬的技術難點之一在于「真」。如果做得不夠逼真、不夠貼近現(xiàn)實,那么依托于模擬之上的自動駕駛系統(tǒng)開發(fā)也會變得失真,最終無法應用于現(xiàn)實世界。
作為「不差數(shù)據(jù)」的頭部公司,Waymo 選擇用手上積累的測試數(shù)據(jù)訓練人工智能系統(tǒng),以更好地模仿真實司機與行人。
在模擬測試中,Waymo 甚至會測試模擬的人類駕駛員與行人是否會撞向?qū)Ψ剑源藖砼袛嗄M的場景是否足夠真實。
Waymo 首席科學家 Drago Anguelov 解釋,這個領域其實才剛剛萌芽。如果你見的模擬器多了,就會發(fā)現(xiàn)它們中許多模擬出的世界并不真實,因而會影響測試效果。
就拿 Uber 來說,最近 Uber 在測試停著的車后站人的場景,結(jié)果顯示模擬器中的車根本不會像現(xiàn)實中一樣減速。
工程師對模擬器精度進行校準時發(fā)現(xiàn),原來車輛只注意到了前方交通信號燈的顏色。綠燈亮起,車輛自然會加速行駛。
Uber 趕緊對這一問題進行了調(diào)整,以保證車輛表現(xiàn)得像現(xiàn)實世界中一樣(靠近紅綠燈才開始識別)。
采集現(xiàn)實世界的數(shù)據(jù)
訓練行為預測的數(shù)據(jù)可以被動地從現(xiàn)實世界中采集,只要車輛配好攝像頭、計算機和互聯(lián)網(wǎng)就行。此后,觀察、預測、標記錯誤并上傳等就可以完成。
訓練溝通與互動的數(shù)據(jù)也能被動采集,只要我們記錄下駕駛員駕駛時的輸入,如轉(zhuǎn)向、加速、剎車和燈光信號等。
在業(yè)內(nèi),我們稱之為模仿學習。
人類駕駛員會手把手向神經(jīng)網(wǎng)絡展示如何與現(xiàn)實世界的道路參與者進行溝通與互動,而神經(jīng)網(wǎng)絡只需要在情境變量相同時執(zhí)行此前學到的動作即可。
從理論上來講,這些有用的數(shù)據(jù)我們也可主動進行采集。
例如,自動駕駛汽車或駕駛員輔助系統(tǒng)做出某一判斷后,如果人類駕駛員給予否定(接管方向盤),那么這次糾正就會成為模仿學習的重要材料。
當然,如果換到強化學習的語境下,系統(tǒng)就能在不斷減少人類干預的情況下等到獎勵。
如果哪家自動駕駛公司能讓神經(jīng)網(wǎng)絡精確模仿人類駕駛員的行為,在模擬時就能精確很多。
完成這一步后,他們就能利用模擬的方法訓練神經(jīng)網(wǎng)絡如何進行駕駛強化學習模式。
不過想要實現(xiàn)這一目標,還是得先從現(xiàn)實世界采集海量數(shù)據(jù)。
模擬器里并沒有駕駛的真知灼見
想學會駕駛,自動駕駛汽車需要準確預測其他道路參與者的一舉一動,同時還能與他們進行溝通和互動,特別是其他車上的人類駕駛員。
想做好預測工作,就得從經(jīng)驗出發(fā)觀察其他道路參與者,而成功的溝通與互動則需要對其他道路參與者的一舉一動了如指掌,這同樣需要經(jīng)驗。
所以說,模擬器里并沒有駕駛的真知灼見,除非它是由經(jīng)驗數(shù)據(jù)訓練出來的神經(jīng)網(wǎng)絡。
想向模仿學習與強化學習借力,自動駕駛汽車可能得在路上行駛上百年,因為系統(tǒng)對經(jīng)驗的需求量實在太過龐大,一個幾百輛車的測試車隊只能算杯水車薪。
當然,即使自動駕駛公司手上有數(shù)百萬輛新車,也不一定能完美實現(xiàn)全自動駕駛,但它們帶來的數(shù)據(jù)肯定可靠性要強得多。
來源:汽車之心