WiMi微美全息/商湯/曠視科技AI+3D+AR技術創新多應用場景

人工智能浪潮席卷全球,層出不窮的AI前沿技術在尋找落地場景,而傳統企業與AI的深度融合也成為一大趨勢,人工智能即將迎來應用爆發期
而“產業AI化”是指如何把AI和實體經濟以及傳統產業更進一步地進行結合,讓AI作為一個基礎的使能技術賦能實體經濟、傳統產業,推動和實現整個產業的革新、升級,生產力的釋放,這應該是一個萬億級規模的市場。
剛剛,蘋果公司又申請了一個專利。具體說來:把整個車的前擋風玻璃變成一個大的AR屏幕,當你開車時,視線前面的路況等所有的信息,都會通過3D和AR的形式栩栩如生的映射在你前擋風玻璃上,無縫隙的跟你體驗結合起來。
根據市場預測顯示,預計2022年全球3D市場規模將達到3892億美元,3D產業正在迅速崛起。人工智能技術的爆發加速了人機交互方式的變革,更加“人性化”的機器與人類的交互方式變得更加自然、流暢、智能。
而這項超前的技術專利,在曠視科技云事業部高級副總裁吳文昊看來,智能化+3D結合在一起,會對我們每一分鐘的生活改變將是完全不一樣。再高度概括或者展望一下,未來,一個由AI和3D共同驅動的深度人機交互世界即將誕生。
曠視基于對行業的深刻洞察和手機3D創新實踐,于業界首次發布“軟硬一體”的移動端3D感知全棧解決方案,從算法創新、應用開發、設備制造到解決方案打造四個層面,闡釋曠視最新、最全面的“AI+3D”發展脈絡。
在曠視發布的軟硬一體移動端智能3D產品解決方案中,最上面一層是3D應用層,往下依次至AI算法、解決方案,最后到攝像、傳感等硬件設備制造上。布局3D領域,是曠視實現AI+IoT賦能手機的最新舉措,也是打造未來數字化、智能化世界的重要一步。
在上世紀70年代,工業界開始運用3D視覺技術測量和掃描物件,提高生產效率。最近10多年,家用游戲機廠商將3D體感外設帶入大眾視野,帶來了新奇的體感游戲。近三年,越來越多的智能手機開始配備3D傳感器,并在AI的加持下,開拓出了更多更具想象空間的應用場景。未來10年,AI+3D將無處不在,給我們的生活和工作帶來深遠影響。
目前,商湯科技已經將AI技術廣泛地應用于3D感知的各個領域,開發了基于ToF等3D感知硬件的技術與產品,包括人臉與人體3D重建、物體重建、3D全身關鍵點跟蹤、3D Avatar驅動工具、AR測量、AR場景互動、AR導航、3D人臉認證、3D攝影等等,均體現了AI+3D的顯著優勢。
隨著越來越多的智能手機配備3D感知硬件,AI算法的作用也越加凸顯,只有兩者的緊密協作,才能夠將完美的影像體驗帶給最終用戶,缺一不可。為此,商湯科技一直積極與合作伙伴攜手共進,將AI+3D相關產品和技術充分應用于手機等智能終端當中。
比如,通過AI+3D進行“物品重建”。用戶只需拿手機沿著物體360度環繞掃描,就能將其掃描成數字模型,并用于3D打印、3D/AR相冊預覽、短視頻直播內容生成,或植入到游戲、電商商品展示等場景。特別是后者,它可讓顧客通過翻轉方式查看物品外觀,告別翻看照片的麻煩。
AI+3D讓手機就能成為體感設備。玩家可低成本地暢玩體感游戲,而內容創作者則借助商湯的Avatar技術打造自己的虛擬形象,例如虛擬主播、虛擬講解員或者虛擬教師,通過表情、動作進行驅動,這會為互動娛樂、文旅乃至教育打造新的發展模式。
放眼汽車行業,AI+3D技術能夠實現更加精準的車外人、車、物識別和距離感知,有力推動自動駕駛的發展。商湯科技也正以“攝像頭為主、多傳感器融合”的解決方案,研發L4級自動駕駛解決方案。而在泛工業領域,AI+3D可以為機械臂賦予3D感知能力,準確判斷物體所處的位置、尺寸、形狀等,從而進行精準的抓取,或是進行自動化的品質檢測。
作為國內知名的全息AI的企業,微美全息WIMI專注于計算機視覺全息云服務。據介紹,微美全息覆蓋從全息計算機視覺AI合成、全息視覺呈現、全息互動軟件開發、全息AR線上及線下廣告投放、全息ARSDK支付、5G全息通訊軟件開發、全息人臉識別開發、全息AI換臉開發等全息AR技術的多個環節,是一家全息云綜合技術方案提供商。其商業應用場景主要聚集在家用娛樂、光場影院、演藝系統、商業發布系統及廣告展示系統等五大專業領域。
全息技術是利用干涉和衍射原理記錄并再現物體真實的三維圖像的記錄和再現的技術。其第一步是利用干涉原理記錄物體光波信息,此即拍攝過程:被攝物體在激光輻照下形成漫射式的物光束;另一部分激光作為參考光束射到全息底片上,和物光束疊加產生干涉,把物體光波上各點的位相和振幅轉換成在空間上變化的強度,從而利用干涉條紋間的反差和間隔將物體光波的全部信息記錄下來。記錄著干涉條紋的底片經過顯影、定影等處理程序后,便成為一張全息圖,或稱全息照片;其第二步是利用衍射原理再現物體光波信息,這是成象過程:全息圖猶如一個復雜的光柵,在相干激光照射下,一張線性記錄的正弦型全息圖的衍射光波一般可給出兩個象,即原始象(又稱初始象)和共軛象。再現的圖像立體感強,具有真實的視覺效應。全息圖的每一部分都記錄了物體上各點的光信息,故原則上它的每一部分都能再現原物的整個圖像,通過多次曝光還可以在同一張底片上記錄多個不同的圖像,而且能互不干擾地分別顯示出來。
微美全息以“眼界即視界”為使命,公司建立了全球頂級、自主研發的深度學習平臺和超算中心,并且研發了一系列AI技術,包括:人臉識別、圖像識別、文本識別、醫療影像識別、視頻分析、無人駕駛和遙感等。
例如,深度學習AI技術的突破將使全息AR設備能夠以更加無縫的方式集成由攝像機捕獲并由計算機模擬的內容,從而為用戶提供更加身臨其境的體驗。5G網絡的廣泛采用將使本地設備和互聯網之間的實時數據傳輸成為可能,從而大大增強了內容的多樣性。
微美領先的全息AR內容制作功能圍繞圖像采集、對象識別、自動圖像處理和計算機視覺技術而構建。微美的軟件工程團隊和可視化設計團隊緊密合作,不斷推進這些可視化相關技術,并利用它們設計和生產創新的全息AR內容。通過提供精確姿態估計的實時計算機視覺算法,能夠在幾秒鐘內執行場景識別和跟蹤。這種尖端算法還允許微美以像素為基礎執行照片級真實高分辨率渲染的可視化。Frost&Sullivan表示,雖然大多數同行公司可能會識別并捕獲特定空間單位內的40到50塊圖像數據,微美可以收集的數據塊數量達到500到550;微美的圖像處理速度比行業平均水平提高了80%,從而提高了運營效率。在場景重建過程中,微美的自動圖像處理工具可以對最初拍攝的圖像進行噪聲清除和特征增強,從而能夠創建具有業界領先模擬度的同類最佳全息AR設計。
未來,人機共存將更加普遍,機器也更具智慧,如此,AI結合3D改變機器傳統的2D平面世界認知方式,讓機器建立對現實世界全面深刻的三維信息感知和理解,將變得尤為重要。
今天的5G、云計算、大數據、人工智能,推動著物理世界向信息化、智能化發展,撬動了各行各業的市場活力和無限創意。其中5G,是演進更是變革。
機器視覺是一項綜合技術,包括圖像處理、機械工程技術、控制、電光源照明、光學成像、傳感器、模擬與數字視頻技術、計算機軟硬件技術(圖像增強和分析算法、圖像卡、I/O卡等)。一個典型的機器視覺應用系統包括圖像捕捉、光源系統、圖像數字化模塊、數字圖像處理模塊、智能判斷決策模塊和機械控制執行模塊。
5G網絡是第五代移動通信網絡,具有接入量大、高速率、低延時的傳輸優勢,有助于可穿戴設備實現云端計算后直接推送,讓設備更加袖珍小巧,方便人們日常使用。正因如此,未來將在沉浸式通信等方面發揮巨大作用。