噓,小點兒聲!我在跟汽車說話呢

2019-12-09 歐陽倩 極客公園
瀏覽

現在只要跨進一輛所謂的「互聯網汽車」里,大家都會第一時間想試試看智能語音助手系統的表現如何。而不管是OEM自研的車機系統,亦或是借助CarPlay、Android Auto、Echo Auto等第三方應用實現的互聯功能,語音識別基本都是標配應用。只不過有一個問題值得思考:對車內這樣的關鍵應用場景,這些技術是否已經具備應用的實力了呢?

還記得在今年CES國際消費電子展的現場,媒體把高通展臺圍了個水泄不通,大家都想看看集成了亞馬遜Alexa語音識別技術的高通智能語音平臺(Qualcomm Smart Audio Platform)會有怎樣的表現。一般來說,工作人員會給出問題,隨后虛擬助手做出相應的回答。但沒想到現場竟然鬧了個烏龍,Alexa打斷了高通某位高層的提問,回答道,「不!你說得不對。」

太尷尬了!

集成了亞馬遜Alexa語音識別技術的高通智能語音平臺|官方供圖

demo演示的時候出現這種不盡如人意的情況,再正常不過了。絕大多數情況下只要聳聳肩,露出一個尷尬而不失禮貌的微笑就可以「蒙混過關」了。但問題是,你在量產車上也經常會遇到類似的bug。你想象中的智能語音助手可能是類似賈維斯的存在,但可能有些時候它會表現得像個弱智一樣,讓人哭笑不得。

所以,現在的智能語音系統基本上識別率還都很低,特別是在嘈雜的環境中。

可問題是,車內的使用場景不會保證是絕對安靜的。想想看,后座的孩子們在扯著嗓子喊叫,救護車明鳴笛疾馳而過,大雨敲擊車窗噼里啪啦的聲音……這些可都是日常生活再普通不過的情況了。

而為了減少噪聲同時提升車內語音識別技術的可靠性,一家來自以色列的初創公司Hi Auto提出了「audio-visual」的解決方案。實現它只需要一枚朝向駕駛員的攝像頭和一枚單聲道麥克風。借助深度學習算法,該系統能夠追蹤用戶唇部的運動軌跡,將圖像與音頻結合起來做識別,這樣可以減少來自其他揚聲器以及噪聲源的干擾。

「清晰的音頻」是這套解決方案期待得到的結果。它能為進一步提升語音識別系統的準確率打下良好的基礎。「我們計劃只提供軟件系統,不需要特殊的硬件匹配。」Hi Auto聯合創始人兼CEO Roy Baharav強調說。

從Nuance中剝離出,集中發力車載語音技術的Cerence每年盈收有近3億美金|官方供圖

有「錢景」的市場

知名咨詢機構羅蘭貝格近日聯合地平線發布的《智能座艙發展趨勢白皮書》中曾對汽車座艙未來的形態進行了預測。羅蘭貝格指出,「觸摸屏不會是交互的終點,未來座艙會朝著多模交互的方向發展」。而不論在哪個階段,語音都扮演著至關重要的角色。

只不過目前語音識別尚處于技術發展初期,即便是在移動端應用上的體驗都沒有那么好,更何況是在場景更復雜、功能安全要求更高的汽車上。而且很多時候,消費者還沒有養成使用語音操作相應功能的習慣,喊一個「hey siri」都讓人覺得尷尬。

在Baharav看來,基于語音的功能控制越來越普遍,即便是在汽車這樣相對傳統的領域。「豪華車型上已經有大規模應用了,這些功能正逐步下發至走量市場。」Haharav表示,而這個現象背后驅動的力量源自一系列基于語音的車機功能變得越來越受歡迎。

Baharav堅信車內的智能語音助手絕不只是供人消遣的娛樂工具。「它們未來會成為執行某項任務的關鍵功能」他同時指出。車內的大屏化正成為現在各大汽車廠商追逐的「潮流」,可問題是,視覺交互很容易讓駕駛員分心,這跟目前汽車工業逐漸嚴苛的安全監管趨勢背道而馳。而從消費者的角度而言,現在智能音箱幾乎都是「白菜價」,大家已經習慣于「動嘴不動手」,這種體驗亟需復制到汽車上,形成無縫的互聯生活。

voicebot.ai最近發布的2019調研報告顯示,約六成的用戶在購車時考慮為智能語音助手功能付費。

voicebot.ai報告顯現,購車時有意愿付費增加語音助手功能的人數在逐漸上漲

據Baharav估計,目前車載語音功能的市場規模在5億美元左右,而且增速很快。他也談到了從Nuance剝離,主要面向汽車業務的獨立子公司Cerence,每年的盈收有近3億美元。而另一家知名的公司SoundHound,市場份額也在逐年增加。值得一提的是,到2025年,通過語音助手實現的商務和廣告收入預計將超過200億美元。

而語音上車,從品牌營銷的角度而言,汽車制造商都希望抓住這項技術應用的紅利期,進一步提升自身產品的競爭實力。「語音控制功能變得越來越重要(谷歌預計到2020年有超過50%的搜索請求是通過語音發起的),主機廠認為他們必須要支持這種新的交互方式。」Baharav解釋道,「否則就是落后,很可能被其他競爭對手趕超。」

持續擴大的場景

目前,語音系統控制的基本都是些和車機相關的功能應用。用戶可以通過語音接聽撥打電話,接收發送短信,播放音樂/視頻等流媒體,執行導航或商務會議等。

那你還能想到哪些和汽車「叨叨」幾句的理由呢?

Baharav介紹了一些可能的應用場景。比如共享出行或者家庭用車,高質量的車載語音技術就變得十分必要了。因為不同的車機系統必須要能夠同時處理不同乘客發出的語音指令。「隨著ADAS高級駕駛輔助功能逐漸成為量產車型的標配,今后我們甚至完全可以用語音向汽車發出變道、超車或者泊車的指令。因此,語音控車技術的可靠性,包括它的抗噪能力就顯得十分關鍵了。」Baharav指出。

更新iOS 13系統后的CarPlay,Siri的運行界面挪到了屏幕底下|現場拍攝

原生優勢如何凸顯?

數字化轉型對傳統主機廠而言是目前的重任之一,所以大家都不希望用戶太過依賴CarPaly、Android Auto等等這些第三方的應用,而是能夠高頻使用原有的車載娛樂信息系統,直接獲得更優質的數字化體驗(當然對數據資源的考慮也是重要原因)。在這種需求導向下,Hi Auto,SoundHound這些技術供應商面臨著谷歌、蘋果、亞馬遜這些大廠的挑戰。

「我們的技術是內嵌式的,有著人性化的設計,能夠為Spotify、Audible、Digital radio、Whatsapp這些主流的APP應用提供車機支持。」Baharav介紹說,「更重要的是,主機廠可以把我們的語音技術與其自有的地圖、廣播、電話/短信、車身控制、ADAS等功能進行集成,一些涉及到汽車硬件的高級集成應用也是沒有問題的。」

「你的車載語音功能至少應該有能夠和Google Assistant,Siri相抗衡的實力才行。」Baharav強調稱。在他看來,汽車變得越來越智能,車企必須要認真打磨自己的語音助手功能體驗。

遺憾的是,目前一些獨立的解決方案,就語音助手的表現質量而言,還有很多不足。特別是在嘈雜的環境,經常會出現「傻掉」的情形。Hi Auto希望通過解決與車內環境相關的難題(短暫的噪聲持續存在,乘客們可能會互相交談等),來進一步凸顯自己的競爭優勢。「我們必須保證機器聽得清用戶發出的指令。」Baharav指出。

亞馬遜開發的Echo Auto車載智能語音硬件|官方供圖

那些糟心的體驗

Hi Auto是帶著清晰的目標進入車載語音市場的,這家公司希望提升揚聲器的拾音和語音識別的能力。在問及普通智能手機或智能音箱在哪些場景的降噪表現較差時,Baharav舉了一個例子來說明:

一位父親開著一輛SUV行駛在高速公路上,車里坐著女兒還有她們的朋友。他和孩子們在聊著剛剛結束的足球訓練。突然,他注意到車快沒油了,所以他不得不改變導航目的地。他不愿意花太多功夫在中控屏上劃來劃去找一家加油站,但車里太吵了(姑娘們正唧唧喳喳地聊著天)以致于語音系統根本聽不到這位父親發出的指令。

Baharav解釋道,「上面這個案例出現的情況,對絕大多數高級定向麥克風都是無解的。因為孩子們坐在駕駛員的正后方。一般的技術是沒辦法把這種噪聲消掉的,因為它不是靜態聲,所以沒辦法被模擬后抵消掉。」

再來看另外的一個例子:

一位女士開車行駛在上班途中,雷聲隆隆,瓢潑大雨持續拍打著車窗。車里的空調已經開到最大,這個時候她想告訴同事她可能上班要遲到了。她雖然知道發短信很危險,但是她一遍遍地對著車載語音系統發出指令,對方回復的則是:對不起,請聲音再大一點……

「這種情景對高級定向麥克風同樣無效。因為這個場景中的噪聲來自多個方向,并非短時靜態的噪聲,所以很難被一般的降噪技術消除掉。」Baharav再次強調稱。

目前,Hi Auto已經正式對外亮相,并完成450萬美元種子輪融資,由以色列汽車進口商Delek Motors及該公司主席Zohar Zisapel領投,其他投資人有Allied Holdings,Goldbell Group和Plug & Play。

據TopMove了解,首筆融資將用于完成Hi Auto首款產品的研發,建立銷售和商務拓展團隊。Baharav透露稱,幾家頂級的汽車制造商計劃2020年初對Hi Auto的技術進行考察。

按照預定的規劃,2020年的CES國際消費電子展之后,Hi Auto會發布首個車載語音解決方案SDK,或通過簡單的授權或基于SaaS模式的云端API形式供客戶使用。