自動駕駛汽車的激光雷達(dá)傳感器通過發(fā)出紅外光脈沖,并測量它們從物體上彈回的時間,傳感器創(chuàng)造點云,建立汽車周圍環(huán)境的3D快照,從而幫助車輛行駛。理解原始的點云數(shù)據(jù)十分困難,而且在機器學(xué)習(xí)時代到來之前,需要訓(xùn)練有素的工程師明確他們希望手動捕獲的特征。據(jù)外媒報道,麻省理工學(xué)院計算機科學(xué)與AI實驗室(CSAIL)研究人員最新發(fā)表了一系列論文,表示可以利用深度學(xué)習(xí)自動處理3D成像應(yīng)用的點云。
(圖片來源:麻省理工學(xué)院)
論文資深作者之一,麻省理工學(xué)院教授Justin Solomon表示,“目前,90%的計算機視覺和機器學(xué)習(xí)僅涉及2D圖像。我們的工作旨在幫助更好地表現(xiàn)3D世界,且不僅限于自動駕駛應(yīng)用,還包括所有需要理解3D形狀的領(lǐng)域?!?
以前,大多數(shù)方法在從數(shù)據(jù)中獲取點云的模式方面都不是特別成功,而這些數(shù)據(jù)是從空間中的3D點中獲取有用信息所必需的。在該團隊的一篇論文中,研究人員展示了他們分析點云的方法EdgeConv,通過使用動態(tài)圖卷積神經(jīng)網(wǎng)絡(luò),能夠?qū)蝹€對象進(jìn)行分類和分割。豐田研究所(Toyota Research Institute)的機器學(xué)習(xí)科學(xué)家Wadim Kehl表示,“該算法通過構(gòu)建相鄰點的圖,可以捕捉層級模式,從而推斷出多種類型的通用信息,可供多種下游任務(wù)使用?!?
此外,該團隊還研究了點云處理的其他方面。例如,大多數(shù)傳感器在3D世界中移動時會改變視角,每次對同一物體重新進(jìn)行掃描時,物體的位置可能與上次看到的不同。要將多個點云合并成一個詳細(xì)的世界視圖,需要對齊多個3D點,這一過程稱為“配準(zhǔn)”(registration)。論文作者之一Yue Wang博士表示,“配準(zhǔn)能使我們將來自不同來源的3D數(shù)據(jù)整合到一個共同的坐標(biāo)系統(tǒng)。否則,我們無法從這些方法中獲取有意義的信息?!?
Solomon和Wang的第二篇論文演示了一種新的配準(zhǔn)算法,稱為DCP(Deep Closest Point,深度最近點),能更好地找到點云的可識別模式、點和邊緣,以便與其他點云對齊。這對于自動駕駛汽車確定其在環(huán)境中的位置(定位)尤為重要。
DCP的一個局限性是其假設(shè)可以看到整個形狀,而不僅是一面。這意味著DCP不能對齊物體形狀的部分視圖(稱為“部分到部分配準(zhǔn)”)。因此,在第三篇論文中,研究人員提出了一種改進(jìn)的算法,稱為部分配準(zhǔn)網(wǎng)絡(luò)(PRNet)。
Solomon表示,現(xiàn)有的3D數(shù)據(jù)與2D圖像和照片相比,往往相當(dāng)混亂、無結(jié)構(gòu)化。Solomon的團隊試圖在沒有大量機器學(xué)習(xí)技術(shù)需要的受控環(huán)境下,從混亂的3D數(shù)據(jù)中獲取有意義的信息。DCP和PRNet標(biāo)明,點云處理的一個關(guān)鍵方面是情境。點云A與點云B對齊所需的幾何特征可能不同于將其與點云C對齊所需的特性。例如,在部分配準(zhǔn)時,一個點云的形狀的一部分可能在其他點云上是不可見的,因此無法用于配準(zhǔn)。
Wang表示,該團隊的工具已被計算機視覺領(lǐng)域和其他領(lǐng)域的許多研究人員使用。接下來,研究人員希望將這些算法應(yīng)用于真實世界數(shù)據(jù),包括從自動駕駛汽車收集的數(shù)據(jù)。Wang還表示,他們還計劃使用自我監(jiān)督學(xué)習(xí),探索訓(xùn)練其系統(tǒng)的潛力,從而最小化所需的人類注釋。
來源:蓋世汽車
作者:羅珊