直到現(xiàn)在,自動駕駛數(shù)據(jù)對于很多研發(fā)公司來說還是一個嚴(yán)守的秘密。自動駕駛汽車每天可以收集4TB或更多的傳感器原始數(shù)據(jù)。今年3月,Aptiv成為自動駕駛系統(tǒng)開發(fā)大公司中第一個公開發(fā)布傳感器數(shù)據(jù)的公司。6月16日,2019年計算機(jī)視覺和模式識別大會(CVPR)在美國長灘開啟。Waymo和Argo AI也在此次會議中發(fā)布了數(shù)據(jù)集。
自動駕駛產(chǎn)生的實時數(shù)據(jù)能讓車輛有效地了解周圍的環(huán)境,并在真實世界中行駛。但只有部分?jǐn)?shù)據(jù)對系統(tǒng)的開發(fā)和改進(jìn)真正有用。在城市街道的自動駕駛測試中,自動駕駛汽車內(nèi)的工程師和技術(shù)人員們會記錄下有趣或有挑戰(zhàn)性的場景。
測試結(jié)束時,所有的數(shù)據(jù)都會從車輛導(dǎo)入數(shù)據(jù)中心,接著對有用的數(shù)據(jù)進(jìn)行分析和標(biāo)記。對于現(xiàn)代自動駕駛系統(tǒng)訓(xùn)練的核心——機(jī)器學(xué)習(xí)系統(tǒng)而言,原始數(shù)據(jù)本身沒有多大價值。數(shù)據(jù)中令人感興趣的對象包括行人、騎自行車的人、動物、交通信號等等。任何傳感器數(shù)據(jù)被用于訓(xùn)練或測試人工智能系統(tǒng)之前,所有對象都需要手工標(biāo)記和標(biāo)注,以便于系統(tǒng)理解。
過去,研究人員創(chuàng)建和發(fā)布的數(shù)據(jù)集相對較小。這些數(shù)據(jù)集的數(shù)據(jù)來源也非常有限,通常僅限于攝像頭數(shù)據(jù)。Aptiv發(fā)布的NuScenes數(shù)據(jù)集除了圖像外,還包括激光雷達(dá)和雷達(dá)數(shù)據(jù)。
Waymo和Argo最近發(fā)布的自動駕駛數(shù)據(jù)集有了很大突破。Waymo稱其數(shù)據(jù)集包含了3000個場景,是Aptive的NuScenes數(shù)據(jù)集的3倍,攝像頭和激光雷達(dá)之間的信息同步也更好。Waymo還提供了5個激光雷達(dá)傳感器的數(shù)據(jù),而NuScenes數(shù)據(jù)集中只有1個。
福特自動駕駛開發(fā)合作伙伴Argo AI的Argoverse數(shù)據(jù)集與Waymo有些不同。雖然它也包含激光雷達(dá)和攝像頭數(shù)據(jù),但它只覆蓋了在邁阿密和匹茲堡記錄的113個場景,包括Argo AI使用的所有9個攝像頭以及2個激光雷達(dá)傳感器的圖像,其中標(biāo)注的目標(biāo)超過10000個。
Argo AI的Argoverse數(shù)據(jù)集的特別之處在于,它是第一個包含高清地圖數(shù)據(jù)的數(shù)據(jù)集。Argo AI目前在其運(yùn)營區(qū)域打造了自己的高清地圖。這些數(shù)據(jù)包含匹茲堡和邁阿密290公里的車道地圖,如位置、連接、交通信號、海拔等信息。Argo AI在其地圖解決方案中大力宣傳的一個功能就是它優(yōu)化處理的能力:能夠精確地知道在哪里尋找交通標(biāo)志和信號,不必掃描整個場景來尋找。
所有這三個數(shù)據(jù)集都在不同的位置提供了真實世界有價值的新信息,研究人員可以利用這些信息來幫助開發(fā)車輛感知和預(yù)測周圍環(huán)境的新算法。