華為iMaster NAIE攜手中國電信海牛平臺亮相2019 TMF亞太峰會

[馬來西亞,吉隆坡,2019年11月13日] 今日舉行的TM Forum 2019數字化轉型亞太峰會上,華為網絡人工智能產品部CTO程磊先生和中國電信集團北京研究院網絡AI中心技術總監錢兵先生,共同發表了《基于中國電信天翼云NAIE的AI容量預測創新成果》主題演講。華為和中國電信合作,將iMaster NAIE(Network AI Engine)作為電信能力的一部分,在中國電信天翼云完成部署,構建了中國電信AI應用開發能力。基于電信天翼云NAIE平臺與中國電信集團的無線智能運維海牛推理平臺展開合作,在無線網絡小區異常檢測,無線小區容量預測場景進行了成功的探索實踐。
華為iMasterNAIE使能網絡智能化,讓網絡AI開發更簡單
隨著5G網絡加速建設,多樣化5G應用場景使網絡數據呈指數級增長,網絡告警故障處理、擴容優化等需求與日俱增。電信行業的運維水平卻沒有跟上業務發展節奏,運營商面臨 OPEX增長大大超過收入增長,成本和效率無法應對跨行業競爭等結構性問題。急需通過網絡自動化和智能化的系統架構性創新解決結構性問題。
華為網絡人工智能產品部CTO程磊介紹華為網絡人工智能引擎(iMaster NAIE)
華為網絡人工智能引擎iMaster NAIE,在云端引入AI并提供數據湖服務,模型訓練服務、模型生成服務和通信模型服務,大幅降低電信網絡AI引入門檻,提升網絡AI開發效率。iMaster NAIE依托華為公有云,涵蓋網絡AI應用開發業務中最復雜部分的工作,如數據準備,數據特征探索,模型調優等,便于開發者快速獲取iMaster NAIE能力,程磊介紹到。
數據湖服務,把數據采集、集成、建模、分析、標注等數據處理工具以及數據治理模板, 以云服務的方式向開發者提供,提升數據治理效率。支持30+類網元,100+種設備自動對接,內置超過10種電信業務場景模板,提供高效的電信數據標注工具和4.8億在線訓練數據樣本,數據準備時間從原來的3個月縮短到1周,節省90%的時間。
模型訓練服務,提供IDE開發環境,包括數據處理、特征提取、模型訓練和驗證等功能,支持業界主流算法框架,如TensorFlow、Caffe2、SParkML等,預置30+電信網絡特征探索工具, 50+電信領域資產,集成多個場景的算法調測、特征服務和處理SDK,讓模型的設計和探索周期從3周減少到1周,縮短70%時間。
模型生成服務,相對模型訓練服務,進一步簡化模型開發過程,只需要輸入符合要求的訓練數據,就可以快速完成模型訓練和驗證,大幅降低電信AI模型開發的技能門檻和周期。以數據中心PUE優化為例,傳統模型開發投入涉及多個角色,包括暖通專家,數據工程師,算法專家,應用開發工程師等,需要至少半年的時間才能完成;而基于模型生成服務,只需要1名暖通專家,2周時間即可訓練出所需模型,整體開發投入降低95%以上。
通信模型服務,基于云端推理框架,支持云化部署,便于業務快速集成。用戶只需調用API,輸入推理數據就可快速完成推理,運行效率高,推理結果可用于業務應用開發。這類服務主要適用于一些模型泛化通用性強的場景,如KPI異常檢測、硬盤故障檢測等。
基于天翼云NAIE和中國電信海牛平臺實現無線網絡容量預測創新實踐
中國電信無線網絡面臨的主要挑戰:網絡故障和體驗類問題事先被發現難,75%的體驗類問題都來自用戶投訴;網絡問題根因定位及追蹤不易,隨著網絡復雜度增加,單純依靠專家經驗解決問題方式效率低下,運維人員大多時間都在定位問題;網絡故障和流量等很難預測精準,暫實現不了精確網絡規劃和控制。
項目引入大數據處理和AI技術,在數據質量控制,無線小區異常檢測,無線小區容量預測三方面展開實踐。依托NAIE的網絡AI數據處理和模型訓練能力,海牛平臺的實時推理和模型評估優化能力,在異常檢測的多路徑選擇算法,短周期容量預測的LSTM算法,長周期容量預測的Fusion融合算法進行創新實踐,大幅提升異常小區檢測準確率和小區流量預測精度。初步評估,試點小區由于容量擁塞導致體驗問題的投訴率下降12%,運維效率提升20%。
中國電信集團網絡AI中心技術總監錢兵介紹無線網絡容量預測TMF催化劑項目實踐
數據質量控制,利用NAIE數據湖提供的能力,結合小區異常檢測和容量預測場景定義數據采集標準和數據元數據規范,將多數據源,多周期,雜亂難理解的低質量數據轉換成統一數據源,易理解高質量數據。針對異常檢測數據,結合專家經驗預置異常門限,自動批量標注。對5000+性能指標進行數據聚類,找出數據周期性,趨勢性,突發性等7類數據特征。為高質量高精度模型訓練提供保證。
異常小區檢測,針對不同指標的不同數據特征多路徑選擇相應算法,結合單指標檢測->專家規則->多指標聯合檢測的三步檢測算法,將異常小區檢測準確率提升到89%。
短周期容量預測,利用KD-tree構建小區空間關系,快速找出小區周邊鄰區關系,利用LSTM Seq2seq算法對小區統一建模,找出用戶行為引起的流量強規律。同時算法還會考慮重大事件,天氣等因素,對突發性事件進行有效預測。對7天的容量預測統計分析,項目預測有效性達到97%。
長周期容量預測無強規律性,受大量外部因素影響,如網絡變更、資費調整等,容量預測的準確率一直是業界的挑戰。項目通過清除非個人因素導致的流量波動異常,按小區特征聚類分組分別建模,按數據特征聚類進行多算法Fusion融合等關鍵手段提升容量預測準確率。對20000個基站小區6個月歷史數據統計分析建模預測未來3個月容量,Fusion融合算法預測有效性可達到80%,相比傳統的Holt-winters算法預測有效性只有39%。
項目取得初步性創新成果,并將繼續孵化,在2020年初應用到中國電信5G網絡規劃,優化和維護領域。并管理監控全國100萬設備的數據質量,服務300萬通信組織和全國3億多無線網絡用戶。“我們的目標是通過AI智能異常檢測和容量預測,讓網絡質量劣化前優化質量,網絡擁塞前調整流量!”錢兵最后說到。