《流浪地球2》里出現(xiàn)的智能量子計(jì)算機(jī)550W,是“MOSS”,某種意義上說(shuō)也算BOSS。
如果切換到當(dāng)時(shí)當(dāng)下的智能電動(dòng)車市場(chǎng),車機(jī)語(yǔ)音助手是否也能成為類似存在,對(duì)答如流又充滿思考性,尚有懸念。但或許,這并不妨礙行業(yè)為之持續(xù)探索。
2月6日,魅族“FlymeAuto主理人計(jì)劃”發(fā)布第四期議題——更聰明的語(yǔ)音手應(yīng)該怎樣?有評(píng)論直接建議“做一個(gè)手機(jī)版MOSS”。
從2022年11月18日起,“FlymeAuto主理人計(jì)劃”徐徐展開,從智能座艙和手機(jī)的N種連接方式,手機(jī)和智能座艙如何協(xié)同才能稱之為最佳拍檔,下車后的便捷操控,到今天這個(gè)語(yǔ)音助手相關(guān)話題,無(wú)一不透露出魅族對(duì)車載OS的思考。
FlymeAuto是魅族手機(jī)操作系統(tǒng)Flyme在智能座艙上的延續(xù),根據(jù)魅族規(guī)劃,F(xiàn)lymeAuto將建立人與人、人與物、物與物之間的互聯(lián)互通,最終實(shí)現(xiàn)多終端、全場(chǎng)景、沉浸式融合體驗(yàn)。
不過(guò)截至目前,F(xiàn)lymeAuto還沒有公開任何實(shí)質(zhì)性進(jìn)展。
結(jié)合魅族做過(guò)手機(jī)的經(jīng)歷,語(yǔ)音助手可能要比之前幾期議題更具討論性。比如,更新到9.3版本的Aicy(前身小溪)可能即將迎來(lái)新的OTA升級(jí)。至于包含了語(yǔ)音、識(shí)屏、縱覽、影像和建議的Aicy在車端會(huì)有怎樣的變化,仍是個(gè)未知數(shù)。
蓋世汽車研究院的數(shù)據(jù)顯示,2022年前8個(gè)月里,語(yǔ)音交互功能在座艙的滲透率已經(jīng)達(dá)到73.3%,僅次于中控屏的89.1%。同時(shí)近三年里,語(yǔ)音交互功能滲透率不斷提升,現(xiàn)已成為汽車標(biāo)配之一。
但從大約十年前車機(jī)語(yǔ)音助手面世以來(lái),其受到的爭(zhēng)議就沒有間斷過(guò)。如今已是成熟年紀(jì),卻基本都還是小孩子。
語(yǔ)音助手最初目的是解放駕駛員和乘客的雙手,利用語(yǔ)音喚醒開啟或者關(guān)閉各種功能。事實(shí)上,市面上大多數(shù)語(yǔ)音助手產(chǎn)品還處于“發(fā)育不成熟”階段?!安慌浜稀钡那闆r也時(shí)有發(fā)生。
比如去年上市的理想L9首度在后排娛樂(lè)屏上應(yīng)用了3D ToF手勢(shì)交互,而非語(yǔ)音助手,但由于技術(shù)欠佳,一度受到詬病。不過(guò)在之后的L7、L8新車型上,理想依然堅(jiān)持選用了車內(nèi)手勢(shì)控制。
相較早期的觸控方式,語(yǔ)音和手勢(shì)交互一定程度上有助于駕駛員集中注意力,降低事故發(fā)生風(fēng)險(xiǎn)。和手勢(shì)相比,語(yǔ)音交互的學(xué)習(xí)成本要更低一些。只是某些場(chǎng)景或者對(duì)于聽力不佳的駕駛員來(lái)說(shuō),手勢(shì)也的確有其優(yōu)勢(shì)所在。
而語(yǔ)音和手勢(shì)若想徹底取代機(jī)械和觸控交互,前提條件一定是,機(jī)器反應(yīng)足夠迅速且失誤率低。至于全自動(dòng)駕駛目標(biāo)的實(shí)現(xiàn),容錯(cuò)率則是零。
以車機(jī)語(yǔ)音交互為例,ASR(包含信號(hào)輸入、降噪以及音素選取等流程)、NLP(包含NLU與NLG,涉及詞性標(biāo)注與文本信息處理)、TTS(包含語(yǔ)音的后端拼接合成,同時(shí)也是語(yǔ)音擬人化核心環(huán)節(jié))等構(gòu)構(gòu)成三個(gè)關(guān)鍵環(huán)節(jié),同時(shí)也是當(dāng)前行業(yè)發(fā)展仍需重點(diǎn)突破的技術(shù)模塊。
另外,擺在“魅族們”面前的,始終還有一個(gè)問(wèn)題:如何讓語(yǔ)音助手更智能,擁有更擬人且連貫的溝通能力。有觀點(diǎn)認(rèn)為,語(yǔ)音助手也可以從ChatGPT的走紅中借鑒經(jīng)驗(yàn)。
行業(yè)有毫末智行借鑒其中的人類反饋強(qiáng)化學(xué)習(xí)RLHF的訓(xùn)練方式,得到人駕自監(jiān)督認(rèn)知大模型。大概思路是,先從模型入手得到一個(gè)獎(jiǎng)勵(lì)模型(reward model),讓其知道什么是好的開法,什么是不好的,以及哪些行為需要改進(jìn),從而訓(xùn)練出更高質(zhì)量的算法模型。
“萬(wàn)物皆可ChatGPT”。從這個(gè)角度看,AI語(yǔ)音助手的算法模型或許也能從中受益,創(chuàng)造更接近真人的互動(dòng)對(duì)話。
圖片來(lái)源:魅族社區(qū)
再者,在差異化、定制化被著重強(qiáng)調(diào)的時(shí)代背景下,語(yǔ)音助手不僅要變聰明,還要有辨識(shí)度,以打造不可替代的產(chǎn)品標(biāo)簽。
在已有的車機(jī)語(yǔ)音助手基礎(chǔ)上,支持自定義喚醒詞、開發(fā)更有吸引力的虛擬形象、人聲,升級(jí)離線語(yǔ)音包等等。顯然,“魅族們”可以做的事實(shí)在太多。最新消息是,魅族在申請(qǐng)注冊(cè)“無(wú)界汽車”商標(biāo)后,又將目光投到了“無(wú)界手機(jī)”上,國(guó)際分類是科學(xué)儀器。
魅族要做的事似乎很多,但最好別丟了西瓜撿芝麻。
來(lái)源:蓋世汽車
作者:徐珊珊
本文地址:http://autopag.com/news/qiye/195317
以上內(nèi)容轉(zhuǎn)載自蓋世汽車,目的在于傳播更多信息,如有侵僅請(qǐng)聯(lián)系admin#d1ev.com(#替換成@)刪除,轉(zhuǎn)載內(nèi)容并不代表第一電動(dòng)網(wǎng)(autopag.com)立場(chǎng)。
文中圖片源自互聯(lián)網(wǎng),如有侵權(quán)請(qǐng)聯(lián)系admin#d1ev.com(#替換成@)刪除。