蔚來眼中的 NOMI 到底能做什么?數(shù)字座艙要朝著哪個方向發(fā)展?蔚來開發(fā) NOMI 的過程遇到了哪些挑戰(zhàn)?還有,未來的 NOMI 們將是怎樣的?
NOMI > 車載語音助手
2017 年,蔚來發(fā)布第一款旗艦 SUV ES8。隨著 ES8 上市,NOMI 成為全球首個量產(chǎn)的車載人工智能系統(tǒng)。
NOMI 取自英文 Know Me 的諧音,代表了蔚來對車內(nèi)智能交互體驗的追求——「懂我」。如果你看過科幻電影《Her》,NOMI 就相當(dāng)于是蔚來版的「Her」。
在蔚來 ES8 和 ES6 開始交付后,NOMI 以智能化、人性化的交互體驗,收獲了一大批車主和蔚來粉絲的喜愛。
許多人認為 NOMI 就是車內(nèi)的語音助手,實際上蔚來在 NOMI 上寄予的期望遠超于此。
更少為人知的是,NOMI 甚至是蔚來展開智能座艙設(shè)計的中心。
不少車企的智能座艙設(shè)計是以屏幕為中心,比如拜騰希望通過大屏的設(shè)計營造一種坐在客廳交互和娛樂的體驗。而蔚來把座艙前方最中心的位置留給了 NOMI。
以 NOMI 為中心,蔚來 ES8 上 9.8 英寸的數(shù)字儀表屏、11.3 英寸的中控屏和 10 英寸的 HUD 依次展開。
實際上,再加上中控屏下方支持手機無線充電的區(qū)域(手機屏),以及 NOMI 本身的屏幕,這 5 塊屏幕就是蔚來數(shù)字座艙體驗的基礎(chǔ)。
開發(fā) NOMI,難在何處?
蔚來 0001 號員工、負責(zé)產(chǎn)品管理的助理副總裁李天舒,在 6 月 5 日「汽車之心·行家說」分享上就講到:
蔚來認為 NOMI 所在的位置是最能體現(xiàn)一輛車靈魂與核心的位置,而其他的屏幕不追求尺寸最大,而是追求合適和好用,并且其他屏幕在一定程度上都在為 NOMI「讓位」。
作為 NOMI 開發(fā)過程中的產(chǎn)品經(jīng)理,他回憶:
當(dāng)時團隊想到的讓 NOMI 做的第一件事并不是完成復(fù)雜的自然語言交互和多輪對話,而是當(dāng)車主打開車門的那一刻,NOMI 可以把車當(dāng)成是自己的肌體一樣,感受到有人進入車內(nèi)了,然后它把頭扭向有人開門的方向,和用戶打個招呼。
「NOMI 與車互為本體,是車輛與用戶交流的唯一面容和靈魂?!?/p>
作為一個 AI 實體,NOMI 能夠通過聲音、表情、動作來展示虛擬助手無法完成的精微互動。比如當(dāng)用戶伸手觸碰屏幕時,NOMI 可以把自己的頭稍微低一點,看看用戶想要在屏幕上面做點什么。當(dāng)用戶把手收回來,NOMI 的頭又會抬回去。
NOMI 的研發(fā)開始于 2015 年,作為一個過去沒有其他車企量產(chǎn)過的 AI 實體,李天舒說 NOMI 開發(fā)過程中遇到了多重挑戰(zhàn):
第一個問題是 AI 的恐怖谷效應(yīng),也就是當(dāng) AI 與人在外表或者動作十分相像時,人類會對 AI 產(chǎn)生好感,但同時隨著相似度增加,人們又會注意到 AI 與人的細微差別,而產(chǎn)生恐懼的心理;
第二個問題是車規(guī)以及工業(yè)設(shè)計的挑戰(zhàn),類似 NOMI 這樣一個幾千元級別的偏消費電子的產(chǎn)品,如何與一輛售價 40 - 50 萬元級別的豪華車相得益彰,外觀上不掉價、不過時;同時這樣的 AI 實體要滿足車規(guī)要求,不能在碰撞試驗中增加用戶的安全風(fēng)險;
第三是 NOMI 有了表情、聲音和動作之后,這些動作如何進行精密同步,這比語音和 TTS(屏幕上的文字)同步,難度要再增加 1 - 2 個臺階。
為了解決第一個問題,蔚來內(nèi)部在開發(fā) NOMI 的過程中,從 2015 年到 2018 年很長一段時間內(nèi),都要求這個產(chǎn)品不能發(fā)出聲音,而只是用表情和一些簡單的(比如嗶哩嗶哩)的聲音來和用戶進行交流,傳遞情感。
NOMI 團隊設(shè)計了一整套能夠讓它與用戶進行交流的情感引擎,這套引擎連接起了車輛的底層網(wǎng)關(guān)、車機、NOMI 的情感庫以及 NOMI 屏幕的電機驅(qū)動器等等,這樣解決了情感互動以及精微動作同步的問題。
NOMI 的工業(yè)設(shè)計最后選擇了極簡的方式實現(xiàn)一個永遠不過時的產(chǎn)品形象:外觀上團隊選擇了純粹的圓形,并且使用了極簡的符號來做表情包。NOMI 選擇的屏幕規(guī)格也相當(dāng)高,是一塊千萬像素級別的屏幕。
取與舍
前面講到,把 NOMI 放在蔚來車輛前方的正中央,讓 NOMI 作為車輛與用戶交互的中心,從而影響了蔚來車內(nèi)屏幕整體的布局和尺寸,這是第一層的取舍。
NOMI 在開發(fā)過程中,內(nèi)部有一個原則是:不顯示功能。
當(dāng)時蔚來在設(shè)計一個疲勞檢測的功能,過去在其他的車上往往會在儀表盤的位置顯示一個小茶杯,那是不是在 NOMI 上也顯示一個茶杯的圖標(biāo);或者當(dāng)用戶在泊車時,用 NOMI 來顯示指引箭頭或者提醒車主掛到 P 檔。
說到這里,李天舒問了一個問題:「我們有沒有見過在人的臉上去畫一個導(dǎo)航箭頭?」
答案當(dāng)然是,沒有。
NOMI 的形象是沒有嘴的。這與前面提到的 AI 的恐怖谷效應(yīng)有關(guān)。
這是因為增加了嘴部后,會導(dǎo)致對話時聲音與嘴型的匹配問題會變得更加復(fù)雜。蔚來在嘗試 NOMI 沒有嘴的設(shè)計之后,發(fā)現(xiàn)反倒是更加和諧、合理的產(chǎn)品形態(tài)。
今天 NOMI 的聲音,選擇的是一個相對接近于女性,同時偏中性的聲音。蔚來在這個聲音的挑選上花費了非常大的精力,并且到今天還在持續(xù)打磨聲音的品質(zhì),其中的要求是能夠?qū)崿F(xiàn)非常獨特的一個聲音質(zhì)感。
2018 年,蔚來還發(fā)布了 NOMI 的第二款產(chǎn)品 NOMI Halo(第一款產(chǎn)品就是大家非常熟悉的圓形的 NOMI Mate)。
NOMI Halo 利用更簡潔的形式,采用光暈+聲音的形式來和用戶實現(xiàn)語音的互動。
輕度劇透:下一代 NOMI
今天的語音技術(shù)與 4、5 年前 NOMI 剛剛開始開發(fā)時,已經(jīng)今非昔比。
李天舒談到,未來,NOMI 會更深度地利用多模態(tài)交交互的方式,結(jié)合車內(nèi)各種各樣的傳感器,利用視覺、聽覺、觸覺來進行感知,與用戶進行交互。
李天舒眼中 NOMI 的未來,是這幾個詞:第一個會開車,第二個是能懂你,第三個是始終陪伴:
會開車:即自動駕駛;
能懂你:結(jié)合視覺、音頻、聽覺、觸覺等多模的方式進行感知和用戶行為理解;
始終陪伴:針對每一個用戶千人千面的學(xué)習(xí),以及用戶體驗的定制化。
如果將這 3 方面的體驗疊加在一起,可以理解為就是類似「Her」帶來的體驗。
在「汽車之心 · 行家說」的分享里,李天舒還展示了第二代的 NOMI。
第二代的 NOMI 依然是全圓形的設(shè)計,采用了車規(guī)級的全圓形的 AMOLED 屏幕,能夠顯示的信息將更加豐富,這樣也能夠允許 NOMI 來展現(xiàn)更多更為人性化的一面。
最后,NOMI 本身在進化,NOMI 也在通過語音的方式幫助蔚來實現(xiàn)車輛的改進,推動 ES8、ES6 以及后續(xù)車型的改進進化。
李天舒提到,到目前為止 NOMI 已經(jīng)和用戶對話了 7000 多萬次,每日的對話量在 20 萬次以上,這些的數(shù)據(jù)量是 NOMI 成長的必要因素。
同時,蔚來可以通過 NOMI 記錄用戶對于車輛的反饋,無論是一些問題改進或者是一些突如其來的靈感。
李天舒說,「其實一個問題發(fā)生的場景往往就是在那一個瞬間才最被需要記錄和解決。」
對車主而言,NOMI 恰恰好是一個便利實時的反饋渠道。
在這個渠道上,蔚來已經(jīng)收集到了用戶上萬條的反饋:比如正在開著自動輔助駕駛,發(fā)現(xiàn)一個地方可能體驗并沒有那么好;或者說突然有了一個靈感,覺得蔚來以后可以這么干。
到目前為止,通過 NOMI 的反饋數(shù)量,占到蔚來整個反饋渠道的 40% 以上。
李天舒說,這個數(shù)量級充分證明了,人們其實還是更渴望去跟一個有生命的伙伴去對話,去反饋和進行交互,并且慢慢也會依賴上這樣的一個形式