亚洲精品无码久久久久久自慰_国产三级永久在线观看_夜夜操天天操_91亚洲自偷在线观看_91国内精品久久久久精品一本

網(wǎng)站LOGO
首頁(yè) > 新聞 > 行業(yè)動(dòng)態(tài) > 自動(dòng)駕駛下的AI識(shí)別 數(shù)據(jù)標(biāo)注賦能背后的自動(dòng)化偽命題

自動(dòng)駕駛下的AI識(shí)別 數(shù)據(jù)標(biāo)注賦能背后的自動(dòng)化偽命題

來(lái)源:高工智能汽車 瀏覽次數(shù):621 發(fā)布日期:2018-05-23
   
    在智能駕駛中,汽車需要通過(guò)在感知、規(guī)劃、決策、控制方面的努力,讓機(jī)器具備“智力”。人們通常愿意把這一個(gè)過(guò)程,稱之為人工智能。而事實(shí)上,所謂的智能只是一個(gè)結(jié)果,想要讓機(jī)械具備智能,過(guò)程當(dāng)中需要無(wú)數(shù)人力勞動(dòng)的堆砌。
    數(shù)據(jù)標(biāo)注就是這樣一個(gè)工作,它存在的意義便是讓機(jī)器理解、認(rèn)識(shí)世界。通常的數(shù)據(jù)標(biāo)注,一般有語(yǔ)音、文本、圖像等類型,工作人員需要更具行業(yè)的標(biāo)準(zhǔn)或者客戶要求,對(duì)相應(yīng)的數(shù)據(jù)進(jìn)行分類、畫框、注釋、標(biāo)記等等,然后將結(jié)果數(shù)據(jù)反饋給客戶??蛻粢来藖?lái)訓(xùn)練機(jī)器對(duì)上述特征的認(rèn)識(shí),C端用戶所體驗(yàn)到的智能語(yǔ)音交互、視覺(jué)圖像識(shí)別等都因此而來(lái)。
    數(shù)據(jù)標(biāo)注是一個(gè)重人工的工作,需要大量人員做簡(jiǎn)單重復(fù)的工作,成本高昂,業(yè)內(nèi)也在尋求一種自動(dòng)化的方式。
    業(yè)內(nèi)人士透露,自動(dòng)化數(shù)據(jù)標(biāo)注在目前的行業(yè)內(nèi)還屬于一個(gè)”遙遠(yuǎn)的夢(mèng)”,在可預(yù)見(jiàn)的時(shí)期內(nèi),數(shù)據(jù)標(biāo)注還將以人為主。
    數(shù)據(jù)標(biāo)注分類
    數(shù)據(jù)標(biāo)注的對(duì)象通常有圖像、語(yǔ)音、文本、視頻、雷達(dá)等。圖像類主要針對(duì)視覺(jué)識(shí)別類公司,所要標(biāo)注的圖像內(nèi)容包括人像、建筑物、植物、道路、交通標(biāo)志、車輛等,每項(xiàng)內(nèi)容下面,又會(huì)根據(jù)不同的特征進(jìn)行不同標(biāo)簽的標(biāo)注。
    以應(yīng)用最廣的人像為例,標(biāo)注公司可能需要對(duì)目標(biāo)的性別、年齡、膚色、著裝、表情、發(fā)型、姿態(tài)做出標(biāo)志,方式會(huì)是畫框、打標(biāo)簽等。
    語(yǔ)音標(biāo)注也是常見(jiàn)的一種,公司會(huì)將音頻的文字對(duì)照寫出,同時(shí)也可能會(huì)將語(yǔ)句中的主謂賓標(biāo)出,方便機(jī)器學(xué)習(xí)。
    隨著激光雷達(dá)在自動(dòng)駕駛中頻繁的應(yīng)用,雷達(dá)對(duì)障礙物掃描識(shí)別的需求也愈加頻繁,而如何讓激光雷達(dá)掃描到的物體通過(guò)更直觀的形式顯示給用戶,也成了要完成的工作。
    數(shù)據(jù)標(biāo)注公司會(huì)將激光雷達(dá)掃描出的物體大概,進(jìn)行更精細(xì)的物體輪廓勾勒,同時(shí)也會(huì)對(duì)相應(yīng)障礙物進(jìn)行標(biāo)識(shí),包括但不限于名稱、類別,以及通過(guò)不同顏色進(jìn)行展示。通過(guò)這種深度處理后,激光雷達(dá)也就間接具備了識(shí)別障礙物的能力。
    無(wú)論圖像、語(yǔ)音還是雷達(dá)數(shù)據(jù)的標(biāo)注,通常數(shù)據(jù)標(biāo)注公司會(huì)有一套自己的標(biāo)準(zhǔn),對(duì)數(shù)據(jù)進(jìn)行分類,而目標(biāo)客戶也會(huì)有自己的標(biāo)注。
    業(yè)內(nèi)人士表示,一般而言,客戶會(huì)有自己的需求,公司依規(guī)而行。目前在國(guó)內(nèi),阿里巴巴、騰訊、百度等大型互聯(lián)網(wǎng)公司,擁有海量的數(shù)據(jù)標(biāo)注需求,單個(gè)訂單量都是以億元為單位。如此大的訂單,基本都是分包給不同的數(shù)據(jù)標(biāo)注公司進(jìn)行處理,國(guó)內(nèi)外還沒(méi)有一家公司能夠處理這樣大的訂單。
    另外還有自動(dòng)駕駛公司,以及視覺(jué)圖像處理的公司,也有著數(shù)據(jù)標(biāo)注的強(qiáng)烈的需求,他們需要用標(biāo)注后的數(shù)據(jù)來(lái)訓(xùn)練人工智能,而人工智能的日趨成熟,是永無(wú)止境的。
    勞動(dòng)密集型產(chǎn)業(yè)
    面對(duì)數(shù)據(jù)標(biāo)注的巨大需求,整個(gè)行業(yè)的技術(shù)水平如何?在回答這個(gè)問(wèn)題之前,首先給大家羅列一組數(shù)據(jù)。
    ImageNet 是一個(gè)計(jì)算機(jī)視覺(jué)系統(tǒng)識(shí)別項(xiàng)目名稱,是由美國(guó)斯坦福的計(jì)算機(jī)科學(xué)家李飛飛教授領(lǐng)銜的團(tuán)隊(duì)模擬人類的識(shí)別系統(tǒng)建立的,它是目前世界上圖像識(shí)別最大的數(shù)據(jù)庫(kù)——1,500 萬(wàn)張標(biāo)注圖片的數(shù)據(jù)集,這是來(lái)自 167 個(gè)國(guó)家的 48,940 名工作者,花費(fèi)了 2 年時(shí)間,清理、分類、標(biāo)記了近十億張通過(guò)互聯(lián)網(wǎng)搜集到的圖片,才得到的。
    由于數(shù)據(jù)龐大又開源,ImageNet 很快成為成為研究圖像識(shí)別的首選。但盡管如此, ImageNet 也有自己的弱點(diǎn):標(biāo)注框太大、標(biāo)注方式少和不時(shí)出現(xiàn)的錯(cuò)誤,使它難以被用來(lái)訓(xùn)練實(shí)際應(yīng)用的算法模型。
    從以上可以看出,即使是業(yè)內(nèi)最強(qiáng)大的圖像識(shí)別庫(kù),數(shù)據(jù)標(biāo)注都是通過(guò)人工完成的。因此,其它宣傳數(shù)據(jù)標(biāo)注自動(dòng)化的,可信度較低。

    業(yè)內(nèi)人士透露,數(shù)據(jù)標(biāo)注是一個(gè)簡(jiǎn)單又困難的事情。簡(jiǎn)單之處在于,確定了篩選規(guī)則以后,操作人員只需依規(guī)操作即可,沒(méi)有執(zhí)行上的難度,而困難之處在于,數(shù)據(jù)標(biāo)注本質(zhì)上是要獲得更準(zhǔn)確,更精細(xì)化的數(shù)據(jù)結(jié)果,高質(zhì)量的數(shù)據(jù)是業(yè)內(nèi)急需的。

    但數(shù)據(jù)標(biāo)注本身是一項(xiàng)枯燥的工作,工作人員需要對(duì)大量數(shù)據(jù)不斷進(jìn)行重復(fù)勞動(dòng),數(shù)據(jù)的一致性很難保證。
    而這些數(shù)據(jù)標(biāo)注的工作,本身是為了提升機(jī)器學(xué)習(xí)的能力,因此這部分工作只能由人來(lái)完成,人與機(jī)器之間的鴻溝,正是機(jī)器要跨越的。
    數(shù)據(jù)標(biāo)注公司目前的做法,是雇傭部分專業(yè)的標(biāo)注人員,然后再外聘一些兼職的人員,共同完成訂單。由于人工成本高昂,大部分?jǐn)?shù)據(jù)標(biāo)注公司,都將公司設(shè)在了三線以下的城市。
    專業(yè)人員跟兼職人員的工作能力,還是存在一定的差距的。為了保證數(shù)據(jù)標(biāo)注的質(zhì)量,通常數(shù)據(jù)標(biāo)注公司還會(huì)設(shè)立審核團(tuán)隊(duì),對(duì)標(biāo)注后的數(shù)據(jù)進(jìn)行把關(guān)。
    數(shù)據(jù)的采集、標(biāo)注都是專業(yè)性很強(qiáng)的工作,必須有針對(duì)性的對(duì)每個(gè)素材進(jìn)行專業(yè)指導(dǎo)。培訓(xùn)的過(guò)程包括了解目標(biāo) - 學(xué)習(xí)規(guī)則 - 線上培訓(xùn)&錄像學(xué)習(xí) - 實(shí)際場(chǎng)景練習(xí) - 達(dá)標(biāo)考試 - 進(jìn)行工作 - 糾錯(cuò)講解&改錯(cuò)(如果錯(cuò)誤嚴(yán)重、產(chǎn)出不達(dá)標(biāo)會(huì)打回規(guī)則學(xué)習(xí)階段)。審核方面公司會(huì)采用多重交叉審核審核機(jī)制進(jìn)行標(biāo)注與審核,嚴(yán)格把控標(biāo)注的每一道流程 。
    業(yè)內(nèi)人士表示,進(jìn)行數(shù)據(jù)標(biāo)注的人力成本還是較高,以語(yǔ)音數(shù)據(jù)為例,客戶通常會(huì)提供完整有效的數(shù)據(jù)音頻,然后以完成的有效時(shí)間段計(jì)量?jī)r(jià)格。
    音頻通常會(huì)包含方言,雜音等,標(biāo)注人員有時(shí)需要反復(fù)聽音頻,才能完成音頻轉(zhuǎn)文字的工作。一小時(shí)的音頻,常常需要一天才能完成,業(yè)內(nèi)給出的價(jià)格通常在300元左右。
    這個(gè)市場(chǎng)完全是自由市場(chǎng),甲乙雙方一方面要兼顧成本、質(zhì)量等因素,另一方面也要考慮到人力成本,由于技術(shù)含量低,上升空間小,做數(shù)據(jù)標(biāo)注工作的大部分都是短期工,從業(yè)人員積極性低,面臨較大的人才流失問(wèn)題。資本市場(chǎng)的博弈,最終要找到一個(gè)平衡點(diǎn),讓工人愿意留下來(lái)繼續(xù)工作。
    眾包下的半自動(dòng)化
    資本逐利,為了降成本,提效率,無(wú)論數(shù)據(jù)標(biāo)注公司還是客戶,都在想辦法提升數(shù)據(jù)標(biāo)注的效率。
    人們談到更多的便是數(shù)據(jù)標(biāo)注自動(dòng)化,但業(yè)內(nèi)人士表示,數(shù)據(jù)標(biāo)注自動(dòng)化是一個(gè)偽命題,除卻技術(shù)可行性,完成自動(dòng)化所需要的人才,在業(yè)內(nèi)都屬鳳毛麟角。
    本質(zhì)上而言,大公司是最有實(shí)力做這部分工作的,但現(xiàn)實(shí)是大公司的數(shù)據(jù)標(biāo)注業(yè)務(wù),基本都外包給了小工司來(lái)做。而小公司,則還沉浸在人海戰(zhàn)術(shù)中。
    數(shù)據(jù)標(biāo)注公司要提高標(biāo)注的效率,以及降低成本,目前所努力的方向基本是眾包、半自動(dòng)化。所謂的眾包,類似于國(guó)外高精地圖的采集,即公司將訂單發(fā)放到網(wǎng)上,讓擁有閑暇時(shí)間的網(wǎng)友來(lái)合力完成數(shù)據(jù)標(biāo)注的工作,中間可能會(huì)涉及到給予一些獎(jiǎng)勵(lì),但相比現(xiàn)在的線下重勞力模式,已經(jīng)減輕了不少成本。
    但眾包的形式,對(duì)數(shù)據(jù)標(biāo)注的工作流程,有了更高的要求。網(wǎng)絡(luò)用戶完成數(shù)據(jù)標(biāo)注,一定要簡(jiǎn)單,快速,容易上手,由此才能普及。目前的數(shù)據(jù)標(biāo)注過(guò)程,需要人工畫框,打標(biāo)簽,還需要后續(xù)的人工審核,整個(gè)流程較為復(fù)雜。
    業(yè)內(nèi)人士表示,現(xiàn)在能提高效率的工作,便是開發(fā)一套網(wǎng)上系統(tǒng),將標(biāo)注工作簡(jiǎn)單化、標(biāo)準(zhǔn)化,為標(biāo)注人員盡量減少一些重復(fù)簡(jiǎn)單的工作。
    開發(fā)這樣一套系統(tǒng),需要專業(yè)的研發(fā)人員,而大部分?jǐn)?shù)據(jù)標(biāo)注公司,鮮少擁有余力來(lái)進(jìn)行這一部分純粹投入、研發(fā)。因此,數(shù)據(jù)標(biāo)注公司未來(lái)的目標(biāo)是能夠?qū)崿F(xiàn)半自動(dòng)化的數(shù)據(jù)標(biāo)注,而這背后,還仍然要依靠眾包。
    所謂的自動(dòng)化標(biāo)注,本身是一個(gè)偽命題,如果數(shù)據(jù)都能通過(guò)自動(dòng)化標(biāo)注了,那本質(zhì)上已經(jīng)不需要標(biāo)注了,因?yàn)槿斯ぶ悄芤呀?jīng)有了如人一般的識(shí)別能力。而這一天什么時(shí)候會(huì)到來(lái)?眾所期待~
相關(guān)新聞:
免責(zé)聲明:
1、凡本網(wǎng)注明來(lái)源:亞洲新能源汽車網(wǎng)www.licuiping.com.cn的所有文字、圖片和音視頻稿件,版權(quán)均為亞洲新能源汽車網(wǎng)www.licuiping.com.cn獨(dú)家所有,任何媒體、網(wǎng)站或個(gè)人在轉(zhuǎn)載使用時(shí)必須注明來(lái)源亞洲新能源汽車網(wǎng)www.licuiping.com.cn違反者本網(wǎng)將依法追究責(zé)任;
2、圖片來(lái)源于網(wǎng)絡(luò),如有侵權(quán),請(qǐng)聯(lián)系我們刪除;
3、本網(wǎng)部分文章系轉(zhuǎn)載,轉(zhuǎn)載均注明來(lái)源,目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點(diǎn)和對(duì)其真實(shí)性負(fù)責(zé),所表述意見(jiàn)也不構(gòu)成任何投資意見(jiàn);如涉及版權(quán)及其他問(wèn)題,請(qǐng)聯(lián)系我們刪除,本網(wǎng)擁有最終解釋權(quán)。
關(guān)于我們

網(wǎng)站介紹

合作客戶

誠(chéng)聘英才

聯(lián)系我們

服務(wù)項(xiàng)目

金牌會(huì)員

品牌廣告

網(wǎng)站建設(shè)

公眾號(hào)
微信群
QQ群
聯(lián)系我們

0755-21036319

我們隨時(shí)等待您的來(lái)訪!

24小時(shí)在線客服

www.licuiping.com.cn 深圳市貓頭鷹信息技術(shù)有限公司 版權(quán)所有| ICP備案:粵ICP備18000966號(hào)