愛數智慧亮相INTERSPEECH 2019，發布日語開源數據庫

2019-09-20 余愷威 IT之家

瀏覽

2019年9月15至19日，全球語音頂級學術會議INTERSPEECH在奧地利格拉茨舉行。本期會議主題為“Crossroads of Speech and Language”，主要探討語言多樣性、應用多樣性以及表達方式多樣性。愛數智慧作為領先的人工智能數據服務提供商，受邀參加本次展會。

作為全球最大的綜合性語音信號處理領域的科技盛會，本屆INTERSPEECH吸引了谷歌、阿里、亞馬遜、滴滴、Facebook等科技互聯網巨頭。會議期間，來自全球學術界和產業界的研究人員齊聚一堂，討論語音領域的新技術，包括語音合成、語音識別、語音增強這些細分領域。在會議上展示的研究成果代表著語音相關領域的最新研究水平和未來的發展趨勢。

隨著人工智能行業的發展和應用場景的落地，數據的重要性愈加凸顯。

北京愛數智慧科技有限公司是一家國內領先的人工智能數據服務提供商，致力于為企業客戶提供語音、圖像、文本數據的結構化數據服務。數據標注是機器感知世界的“起點”，將混亂和無序的數據進行清洗，將規范化的數據“喂養”給模型才能不斷提高AI的使用精度。

為了滿足市場對結構化數據的需求，愛數智慧自主研發了大數據結構化RPA平臺，利用人工智能技術對數據采集、標注、質檢等過程進行監督，為數據結構化過程賦能。基于該平臺，愛數智慧的數據結構化程度好，數據制作精度高。愛數智慧有效地結合監督學習、半監督/無監督學習、遷移學習、自適應等AI技術為客戶提供全鏈的數據服務。同時，基于對行業趨勢的判斷和客戶需求的洞察，愛數智慧建立了多語種發音詞典和標簽體系，為客戶提供高效的定制化服務。愛數智慧的技術團隊成員是來自多領域的專家，多元的知識背景和從業經驗能夠保證技術解決方案的先進性和高效率。

目前，愛數智慧已經有超10萬小時多語種多場景的標準數據集。線上采集的數據集與標準數據集疊加訓練模型，能大幅縮短訓練時間，提高識別效率，降低建模成本。幫助AI公司及行業內頭部客戶獲得精度可達99%的數據快速處理能力，并以此為基礎搭建人工智能應用。

愛數智慧亮相INTERSPEECH 2019，發布日語開源數據庫

愛數智慧大力推動數據開源，為促進AI行業發展添薪蓄力。會議期間，愛數智慧發布了日語手機朗讀開源數據庫。該數據庫由37位來自日本不同區域（關東、關西、北海道等）的發言人參與采集，錄制文本為日常用語，用于語言識別測試。此前，愛數智慧還在OpenSLR上開源了755小時的中文手機朗讀數據庫，可用于訓練、開發、測試等多種用途。

愛數智慧亮相INTERSPEECH 2019，發布日語開源數據庫