【艾瑞專訪】龍夢竹: AI的“規模化”與“高可用”

2020-04-21 王樂樂 艾瑞網
瀏覽

2019年,思必馳實現了近3倍業績增長,為2019年交了一份亮眼的答卷。

2020年是思必馳創建的第十三年。在過去的十三年間,公司以賦能終端為重點業務,在智能車載與家用智能終端領域打下基業。近兩年,陸續切入企業智能信息服務市場、攜手中芯聚源推出語音AI專用芯片,為完善全鏈路的對話式人工智能技術不斷加碼,將形成公司新的增長曲線。

4月初,在思必馳剛剛獲得4.1億元E輪融資后,首席營銷官龍夢竹接受了艾瑞網的訪問,共話智能語音的發展。

image001.png龍夢竹,思必馳首席營銷官

平臺化始終是信息技術行業追逐的終極商業模式,因為產品規模化才能帶來企業體量上規模,但高度定制卻是客戶的現實需求。

對于思必馳而言,把“規模化”與“高可用”兩個看似難以調和的對立面統一、融合起來,真正把高可用定制能力交給客戶,是智能語音在終端業務發展的核心命題。

企業的戰略思考,源于產業的宏觀背景。

我國信息技術行業已歷經數十年發展,2018年產值超6萬億元,是2000年的100倍,多年來,平臺化一直是信息技術行業的發展熱點。一方面,聚合多樣化、多層級服務能力的平臺經濟創造了新興經濟和新商業模式,另一方面,平臺所提供的標準化/半標準化產品通過將研發中基礎環節與模塊規模復制,降低流程成本和項目交付中研究人員的時間成本,實現了一定程度的規模經濟。具體而言,互聯網的發展推出了大平臺的概念,而云計算本身就具有明顯的平臺化、標準化/半標準化服務的特征,其快速發展是信息技術行業平臺化發展的一大信號,物聯網產業近年的發展也以平臺與連接層為重心。

image003.png

云計算是虛擬化和分布式的技術體系統總稱,能夠隨需應變地從可配置計算資源共享池中獲取各類資源。云計算本身就具有明顯的平臺化、標準化/半標準化服務的特征,其快速發展是信息技術行業平臺化發展的一大信號。

image006.png

物聯網是將各種信息傳感設備與互聯網結合起來而形成的一個巨大網絡,2019年物聯網平臺與連接層融資事件占行業一半以上。

然而,人工智能的平臺化之路卻并非十分順利。

在人工智能領域,過去四年,AI平臺也是使人工智能走進大眾視野的先鋒,百度AI開放平臺、Face++、訊飛開放平臺等使AI明星企業迅速得到廣泛認知,但與AI平臺聚攏大量開發者、快速推動行業普及形成鮮明對比的是,從商業視角來看,平臺化標準服務模式產生的收入量級還是大幅低于定制解決方案模式產生的收入,艾瑞統計的2019年企業級與公共級服務市場中國智能語音市場規模中,平臺化輸出僅占30%(因消費終端品類繁多、統計口徑復雜,未包含在內,以企業級與公共級服務市場數據供讀者參考)。高度定制仍然是客戶的現實需求,這一矛盾成為眾多AI公司發展中面臨的問題。

思必馳敏銳地抓住了矛盾中蘊藏的機會。龍夢竹談到,近年公司發展進入超高速階段,面臨著定制項目接不過來的問題。思必馳給出的解決辦法是:把前臺的定制交由客戶做,自己做好后臺服務,擴大能夠支持的客戶范圍,提高項目快速交付的能力。2017年7月,思必馳以對話為核心,自主研發了全鏈路智能對話定制平臺DUI,為開發者提供高可用定制的人機對話技術服務,為智能終端開發者提供核心交互能力,協助傳統設備實現智能升級。DUI平臺的成功有兩個要素:

(1)全鏈路的智能對話技術。DUI平臺囊括的技術能力,包括算法降噪、回聲消除、語音識別、語音合成、聲紋識別、自然語言理解、智能交互決策、知識圖譜、對話管理等全鏈路智能語音語言技術服務,能夠覆蓋的場景也涵蓋從近場到遠場交互、從有屏到無屏的多版本開發套件。這樣一來,從信號處理到對話管理等全鏈路對話技術與開發件就形成了隨插即用的模塊,使DUI平臺用戶除能夠常規地定制喚醒詞、合成音外,還能對產品每一輪交互邏輯、知識圖譜、產品技能、圖形用戶界面做深度定制。

(2)能夠提供芯片級一站式方案(Turnkey)。語音AI芯片,是思必馳在打通“全鏈路”鏈條上的最后一環。過去,家用智能終端對交互沒那么高要求,也就不太需要芯片級的交互體驗;而近幾年,家用智能終端的交互場景越來越高頻,傳統上采用主控芯片+AI加速器的方案會造成設備功耗很高、不符合綠色能源要求,用戶體驗也不夠好,這些問題需要專用AI芯片來解決,與此同時,搭載一顆AI芯片也能夠節約一定的定制開發費和技術授權費,產品更容易標準化,也容易解決在規模化前提下實現高度定制的問題。

QQ截圖20200420140955.png思必馳產品方案簡介

成功并非一蹴而就,事實上過去在開發平臺方面,思必馳也曾走過一段彎路。2014年,思必馳上線了國內最早的對話智能云平臺——對話工廠,但這一時期的對話工廠是一個免費的開放性平臺,很難針對開發者面臨的各種各樣復雜環境提供其需要的技術,在“落地”上踩了坑,后來2015年上線的AIOS端云一體化對話AI操作系統已經能夠對終端交互的功能和場景特點做整合、提供中間件,能夠較快地調用組合成產品方案,但還沒有真正把高可用定制能力交給客戶,做到技術能力針對各不同場景的自由組合搭配。于是兩年后,DUI平臺整裝上線,之前積累的數年經驗,也成為思必馳能夠領先一步、完成AI“規模化”與“高可用”對立統一的財富。

能不能應對不同場景下復雜的端到端口語交互需求,是對話式AI的試金石。

龍夢竹將人機交互劃分為四類。

image010.png

任務型對話,一般是多輪對話,而且需要后臺內容支撐與復雜任務處理的能力,如訂票就是一個典型的任務型對話場景,背后涉及的技術和數據十分復雜,比同樣多輪的“閑聊型AI”支持更復雜的深度語義,同時要求能對具體場景和上下文做出合適的判斷,最終以滿足用戶的真實需求來作為交互成功的標準。

龍夢竹介紹,這四種當前主流的人機對話類型,都屬于被動的理解用戶意圖。尤其在以信息交流為目的的問答式AI方面,多采用“一問一答”的模式。而現在的咨詢溝通的難點是,用戶只關注單點信息,不知道還有很多未知但又重要的連鎖信息,比如辦理一項業務時,用戶可能一時間只能想到要詢問手續費金額,這時就需要機器人去啟發用戶去關心都需要準備哪些材料、需要提交的時點等。

思必馳針對企業智能信息服務所需要的任務型對話,研發了基于生成式模型的啟發式對話技術,推出了會話精靈(Talking Genie)企業智能服務的定制平臺,提供智能客服(呼叫中心)及知識機器人等。通過啟發式對話技術和復雜結構知識管理技術,會話精靈通過啟發式對話適當引導用戶關注焦點,把它認為有效的信息都通過反問和引導的方式傳遞給用戶,幫助用戶獲取更清晰準確的信息,用于營銷、內部培訓等知識溝通交互情況時,有很好的實踐效果。2019年,順豐、重慶農村商業銀行、碧桂園等各行各業的頭部企業已經開始推行使用。

image012.png會話精靈對話案例

QQ截圖20200420141342.png思必馳企業智能服務系統架構

在適配多種用戶場景時,支持“全雙工”架構的語音交互技術為用戶使用體驗增添了一重保障,龍夢竹認為,特定單一場景下的全雙工語音還不夠智能,比如AI只能在音樂播放功能上實現語義打斷、多輪交互選擇音樂,是無法滿足實際場景中用戶的交叉需求的,思必馳已經能夠實現跨領域的全雙工,比如在語音選擇音樂播放過程中,可隨時岔開話題進行語音訂票、詢問去外地出差的注意事項。能不能應對復雜的查詢需求,是AI人機交互產品需要關注的重點。

厚積方能薄發,長期對技術的專注是思必馳能夠通過全鏈路語音技術、芯片模組實現規模化高度定制的法門,也是其人機交互產品能夠越眾而出的基礎。未來,思必馳依然將在人性化的語音交互技術上繼續深挖,圍繞 “云+芯”重點布局,聚焦智能終端和企業智能對話服務,打造極致體驗的交互產品。