2022年1月7日,微軟正式宣布,在基于微軟智能云Azure的深度神經(jīng)網(wǎng)絡(luò)TTS(Text-to-Speech)支持下,中國領(lǐng)先的智能電動汽車公司小鵬汽車已經(jīng)順利完成其車規(guī)級語音助手的升級,進(jìn)一步提升智能汽車語音助手的技術(shù)水準(zhǔn)。
目前,購買小鵬汽車P7車型的中國用戶,可以通過OTA(Over-The-Air)升級這款可媲美人聲的全新智能語音助手“小P”,小鵬汽車也計劃通過OTA將這一技術(shù)升級引入其他幾款車型當(dāng)中。
據(jù)悉,在為期數(shù)月的合作中,微軟與小鵬汽車攜手攻克了語音合成技術(shù)應(yīng)用面臨的三個技術(shù)挑戰(zhàn):
首先,為了解決汽車場景下的網(wǎng)絡(luò)抖動問題,高質(zhì)量保障語音功能的持續(xù)運(yùn)行,小鵬汽車搭建了多級緩存架構(gòu),可以提前預(yù)置和緩存高質(zhì)量語音文件,最大程度上降低了該功能對網(wǎng)絡(luò)的依賴;
其次,為了在不占用過多資源的前提下,依然能提供媲美人類的真實(shí)聲音體驗(yàn),小鵬汽車借助了微軟智能云Azure的緩存和壓縮功能,可以將語音文件壓縮到24KHz的采樣率和16位的量化水平,大大減少了數(shù)據(jù)網(wǎng)絡(luò)和整車算力的資源壓力;
最后,雙方還在減少合成語音歧義和多音字優(yōu)化準(zhǔn)確性方面做出了諸多改進(jìn)。
在雙方的努力下,全新的車載語音合成功能在語音保真度、功能性和場景優(yōu)化上都達(dá)到了新的水平,小鵬汽車能夠在更多的使用場景中部署語音助手,讓其成為直觀駕駛體驗(yàn)中不可或缺的一部分。