自動(dòng)駕駛汽車的激光雷達(dá)傳感器通過(guò)發(fā)出紅外光脈沖,并測(cè)量它們從物體上彈回的時(shí)間,傳感器創(chuàng)造點(diǎn)云,建立汽車周圍環(huán)境的3D快照,從而幫助車輛行駛。理解原始的點(diǎn)云數(shù)據(jù)十分困難,而且在機(jī)器學(xué)習(xí)時(shí)代到來(lái)之前,需要訓(xùn)練有素的工程師明確他們希望手動(dòng)捕獲的特征。據(jù)外媒報(bào)道,麻省理工學(xué)院計(jì)算機(jī)科學(xué)與AI實(shí)驗(yàn)室(CSAIL)研究人員最新發(fā)表了一系列論文,表示可以利用深度學(xué)習(xí)自動(dòng)處理3D成像應(yīng)用的點(diǎn)云。
(圖片來(lái)源:麻省理工學(xué)院)
論文資深作者之一,麻省理工學(xué)院教授Justin Solomon表示,“目前,90%的計(jì)算機(jī)視覺(jué)和機(jī)器學(xué)習(xí)僅涉及2D圖像。我們的工作旨在幫助更好地表現(xiàn)3D世界,且不僅限于自動(dòng)駕駛應(yīng)用,還包括所有需要理解3D形狀的領(lǐng)域。”
以前,大多數(shù)方法在從數(shù)據(jù)中獲取點(diǎn)云的模式方面都不是特別成功,而這些數(shù)據(jù)是從空間中的3D點(diǎn)中獲取有用信息所必需的。在該團(tuán)隊(duì)的一篇論文中,研究人員展示了他們分析點(diǎn)云的方法EdgeConv,通過(guò)使用動(dòng)態(tài)圖卷積神經(jīng)網(wǎng)絡(luò),能夠?qū)蝹€(gè)對(duì)象進(jìn)行分類和分割。豐田研究所(Toyota Research Institute)的機(jī)器學(xué)習(xí)科學(xué)家Wadim Kehl表示,“該算法通過(guò)構(gòu)建相鄰點(diǎn)的圖,可以捕捉層級(jí)模式,從而推斷出多種類型的通用信息,可供多種下游任務(wù)使用?!?
此外,該團(tuán)隊(duì)還研究了點(diǎn)云處理的其他方面。例如,大多數(shù)傳感器在3D世界中移動(dòng)時(shí)會(huì)改變視角,每次對(duì)同一物體重新進(jìn)行掃描時(shí),物體的位置可能與上次看到的不同。要將多個(gè)點(diǎn)云合并成一個(gè)詳細(xì)的世界視圖,需要對(duì)齊多個(gè)3D點(diǎn),這一過(guò)程稱為“配準(zhǔn)”(registration)。論文作者之一Yue Wang博士表示,“配準(zhǔn)能使我們將來(lái)自不同來(lái)源的3D數(shù)據(jù)整合到一個(gè)共同的坐標(biāo)系統(tǒng)。否則,我們無(wú)法從這些方法中獲取有意義的信息?!?
Solomon和Wang的第二篇論文演示了一種新的配準(zhǔn)算法,稱為DCP(Deep Closest Point,深度最近點(diǎn)),能更好地找到點(diǎn)云的可識(shí)別模式、點(diǎn)和邊緣,以便與其他點(diǎn)云對(duì)齊。這對(duì)于自動(dòng)駕駛汽車確定其在環(huán)境中的位置(定位)尤為重要。
DCP的一個(gè)局限性是其假設(shè)可以看到整個(gè)形狀,而不僅是一面。這意味著DCP不能對(duì)齊物體形狀的部分視圖(稱為“部分到部分配準(zhǔn)”)。因此,在第三篇論文中,研究人員提出了一種改進(jìn)的算法,稱為部分配準(zhǔn)網(wǎng)絡(luò)(PRNet)。
Solomon表示,現(xiàn)有的3D數(shù)據(jù)與2D圖像和照片相比,往往相當(dāng)混亂、無(wú)結(jié)構(gòu)化。Solomon的團(tuán)隊(duì)試圖在沒(méi)有大量機(jī)器學(xué)習(xí)技術(shù)需要的受控環(huán)境下,從混亂的3D數(shù)據(jù)中獲取有意義的信息。DCP和PRNet標(biāo)明,點(diǎn)云處理的一個(gè)關(guān)鍵方面是情境。點(diǎn)云A與點(diǎn)云B對(duì)齊所需的幾何特征可能不同于將其與點(diǎn)云C對(duì)齊所需的特性。例如,在部分配準(zhǔn)時(shí),一個(gè)點(diǎn)云的形狀的一部分可能在其他點(diǎn)云上是不可見(jiàn)的,因此無(wú)法用于配準(zhǔn)。
Wang表示,該團(tuán)隊(duì)的工具已被計(jì)算機(jī)視覺(jué)領(lǐng)域和其他領(lǐng)域的許多研究人員使用。接下來(lái),研究人員希望將這些算法應(yīng)用于真實(shí)世界數(shù)據(jù),包括從自動(dòng)駕駛汽車收集的數(shù)據(jù)。Wang還表示,他們還計(jì)劃使用自我監(jiān)督學(xué)習(xí),探索訓(xùn)練其系統(tǒng)的潛力,從而最小化所需的人類注釋。
來(lái)源:蓋世汽車
作者:羅珊