澎湃新聞?dòng)浾甙l(fā)現(xiàn),首次出現(xiàn)在國(guó)際最大的計(jì)算機(jī)視覺算法集道路場(chǎng)景分割排行榜上。榜單顯示,阿里團(tuán)隊(duì)iDST獲得三項(xiàng)分割任務(wù)第一,包括UU_ROAD(鄉(xiāng)村車道)與UMM_ROAD(多車道)兩項(xiàng)特定場(chǎng)景任務(wù),及整體場(chǎng)景的綜合評(píng)測(cè)任務(wù)URBAN_ROAD(城市車道)。阿里巴巴方面向澎湃新聞證實(shí)了這一消息,不過(guò)否認(rèn)阿里將進(jìn)軍自動(dòng)駕駛業(yè)務(wù)。
阿里方面表示,該公司重視基礎(chǔ)科學(xué)研究,自動(dòng)駕駛技術(shù)是其中一部分,該項(xiàng)研究正由阿里巴巴機(jī)器視覺科學(xué)家任小楓率領(lǐng)。
據(jù)了解,KITTI數(shù)據(jù)集是自動(dòng)駕駛技術(shù)研發(fā)必選的調(diào)測(cè)平臺(tái),圖森、宇視、三星、日本電氣(NEC)等公司都曾出現(xiàn)在排行榜上。
資料顯示,KITTI數(shù)據(jù)集由德國(guó)卡爾斯魯厄理工學(xué)院和豐田美國(guó)技術(shù)研究院聯(lián)合創(chuàng)辦,是國(guó)際公認(rèn)的最大自動(dòng)駕駛計(jì)算機(jī)算法評(píng)測(cè)數(shù)據(jù)集。
KITTI數(shù)據(jù)集涵蓋城市、住宅區(qū)、道路、校園、行人等五大場(chǎng)景,采用更適合自動(dòng)駕駛的BEV(Bird's Eye View,鳥瞰)視角評(píng)大多數(shù)自動(dòng)駕駛研究機(jī)構(gòu)都能做到對(duì)城市道路的大塊分割,但對(duì)于邊緣路面,例如石頭、車輛沿路??康冗€存在很大識(shí)別難度。如何把道路邊緣分割得更為精細(xì),是目前道路場(chǎng)景分割的主要攻堅(jiān)方向。
阿里巴巴的一份聲明稱,由任小楓帶領(lǐng)的阿里iDST視覺技術(shù)團(tuán)隊(duì)提出基于在線難樣本挖掘的網(wǎng)絡(luò)學(xué)習(xí)方法,同時(shí)在網(wǎng)絡(luò)中增加在線數(shù)據(jù)增強(qiáng)模塊,及全局特征、局部特征融合機(jī)制,提升網(wǎng)絡(luò)特征的表征能力與推廣能力,以解決道路分割問(wèn)題中的道路邊沿與車輛周圍路面分割不準(zhǔn)確、陰影干擾等問(wèn)題。
經(jīng)過(guò)半年時(shí)間研究,阿里以96.06%、97.70%的分割準(zhǔn)確率分別獲得UU_ROAD(鄉(xiāng)村車道)、UMM_ROAD(多車道)兩項(xiàng)特定場(chǎng)景評(píng)測(cè)任務(wù)第一,96.76%的準(zhǔn)確率獲整個(gè)道路場(chǎng)景分割綜合評(píng)測(cè)任務(wù)URBAN_ROAD第一。這也是阿里巴巴首次出現(xiàn)在KITTI道路場(chǎng)景分割的排行榜上。
2017年6月,澎湃新聞率先報(bào)道了亞馬遜最高級(jí)別華人科學(xué)家任小楓入職阿里iDST團(tuán)隊(duì)的消息。任小楓曾主導(dǎo)亞馬遜Amazon
Go無(wú)人店算法,在他入職阿里時(shí),曾被贊在圖像領(lǐng)域的專家中非常難得:“在計(jì)算機(jī)視覺領(lǐng)域中對(duì)圖像分類,物體識(shí)別、跟蹤、檢測(cè),事件檢測(cè)均有全面且深入的理解?!?
澎湃新聞?dòng)浾咄瑯影l(fā)現(xiàn),在KITTI數(shù)據(jù)集的其他幾個(gè)項(xiàng)目中也看到了阿里巴巴iDST,包括車輛檢測(cè)、行人檢測(cè)與行人再識(shí)別部分。據(jù)介紹,這部分技術(shù)已經(jīng)在阿里云ET城市大腦的場(chǎng)景中落地,目前主要用于城市交通管理。
阿里巴巴的科研能力正在崛起,且強(qiáng)調(diào)對(duì)基礎(chǔ)科學(xué)的研究投入。在2017年的杭州云棲大會(huì)上,阿里宣布成立探索人類科技未來(lái)的實(shí)驗(yàn)室“達(dá)摩院”,計(jì)劃在三年內(nèi)對(duì)新技術(shù)投資超過(guò)1000億人民幣,用于涵蓋基礎(chǔ)科學(xué)和顛覆式技術(shù)創(chuàng)新的研究。阿里巴巴董事局主席馬云希望將“達(dá)摩院”作為阿里巴巴留給世界最好的東西之一。價(jià)方式,包含眾多難度較大的無(wú)標(biāo)識(shí)線道路。
從KITTI官網(wǎng)來(lái)看,這項(xiàng)評(píng)測(cè)數(shù)據(jù)集主要分為場(chǎng)景分割、目標(biāo)檢測(cè)、目標(biāo)跟蹤等大類。一位研究人員告訴澎湃新聞,其中道路場(chǎng)景分割在自動(dòng)駕駛領(lǐng)域至關(guān)重要,主要應(yīng)用在自動(dòng)駕駛中的可行駛區(qū)域劃分、自動(dòng)駕駛路徑規(guī)劃、高精地圖構(gòu)建以及輔助駕駛的AR(增強(qiáng)現(xiàn)實(shí))導(dǎo)航。