據(jù)外媒報道,Waymo研發(fā)的自動駕駛汽車利用計算機視覺技術和人工智能識別周圍環(huán)境,并對車輛應該如何反應和移動做出實時決策。當車內攝像頭和傳感器感知到物體時,此類物體會與Alphabet編制的大型數(shù)據(jù)庫中的物體進行匹配,以便進行識別。
(圖片來源:Waymo)
大量的數(shù)據(jù)集對于自動駕駛汽車的訓練至關重要,因為數(shù)據(jù)集可以讓車內的AI變得更好,并提升性能。不過,工程師們需要一些方法,有效地將數(shù)據(jù)集中的物體與查詢的物體匹配起來,從而可以研究AI是如何處理特定類型的圖像。據(jù)外媒報道,為了解決該問題,Waymo最近研究了一個名為“內容搜索”(Content Search)的工具,其功能與谷歌圖像搜索(Google Image Search)和谷歌照片(Google Photos)的操作類似。此類系統(tǒng)可以將查詢內容與圖像中的語義內容進行匹配,以表示物體,讓基于自然語言查詢的圖像檢索變得更加簡單。
在“內容搜索”工具出現(xiàn)之前,如果Waymo的研究人員想要從日志中檢索特定樣本,需要利用啟發(fā)法描述該物體。必須使用利用規(guī)則搜索物體的命令搜索Waymo的日志,意味著需要以 “X高度以下”或“以每小時y英里的速度移動”的命令搜索物體。此類基于規(guī)則進行搜索的結果通常非常廣泛,研究人員需要手動進行梳理,以得到結果。
通過創(chuàng)建數(shù)據(jù)目錄,對不同目錄進行相似度搜索以便在呈現(xiàn)對象時找到最相似的類別,“內容搜索”工具成功解決了上述問題。如果顯示給“內容搜索”工具的是一輛卡車或一棵樹,該工具返回的結果就是Waymo自動駕駛汽車遇到的其他卡車或樹。因為自動駕駛汽車在行駛時會記錄下周圍物體的圖像,然后將此類物體以嵌入式或數(shù)學形式進行存儲,意味著該工具可以對對象類別進行比較,并根據(jù)存儲的對象圖像與提供的對象的相似程度對響應進行排序,與谷歌的嵌入相似度匹配服務的工作方式類似。
Waymo汽車遇到的物體雖然具備各種形狀、各種大小,但是都需要經過提煉,變成基本組件,并進行分類,以便“內容搜索”工具能夠進行工作。為了實現(xiàn)該目標,Waymo使用了多個AI模型,而且此類模型都在各種各樣的物體上進行了訓練。不同的模型會學習識別不同的物體,而且由“內容搜索”工具提供支持,從而可以讓模型理解是否能夠在給定圖像中找到屬于特定類別的物體。除了主模型之外,Waymo還額外使用了一個光學字符識別模型,可以讓Waymo的車輛根據(jù)圖像中的文本,向圖像中的物體添加額外的識別信息。例如,配備了標識的卡車在“內容搜索”描述中會具有包含標識的文本。
由于上述模型協(xié)同工作,Waymo的研究人員和工程師們能夠為特定種類的樹木和特定品牌的汽車等特定物體,搜索圖像數(shù)據(jù)日志。
此次并不是Waymo首次利用多種機器學習模型以提高車輛可靠性和準確性。過去,Waymo曾與Alphabet/谷歌合作,幫助DeepMind一起研發(fā)AI技術。該AI系統(tǒng)從進化生物學中獲得靈感,首先,創(chuàng)建了各種各樣的機器學習模型,在經過訓練之后,表現(xiàn)不佳的模型會被踢出,并被后代模型所取代。據(jù)報道,此種技術成功地減少了誤報數(shù)量,同時也減少了所需的計算資源和訓練時間。
來源:蓋世汽車