專注FPGA圖像加速領域,深維科技跨入發展快車道

日前,在2019賽靈思開發者大會(美洲站)上,深維科技正式面向全球發布ThunderImage三款重磅圖像加速產品:全球最快的JPEG2JPEG縮略圖方案、超高性能的JPEG2WebP轉碼方案及世界級超高密度算力的JPEG2JPEG縮略圖方案。新產品一經發布立即“技驚”四座。與此同時,深維科技迅速的發展勢頭,也引起業內的廣泛關注。這家專注于FPGA圖像加速領域的新銳公司,經過3年的發展,已然邁入了全面提速的發展階段。
全球領先三款圖像加速產品全部斬獲大客戶
1.全球最快的JPEG2JPEG縮略圖方案
該方案主要應用于手機云相冊、云存儲等領域,可提供高達20倍的算力(相較于CPU方案)。即對于相關業務的服務器集群,采用該方案后,用一臺CPU服務器(配置一張AlveoU200加速卡),最高可替換20臺同樣型號的CPU服務器。完成同樣功能和算力的服務器集群可縮減10倍功耗。它的出現大大降低了數據中心的采購成本、運營成本。同時,服務器的服務響應時延可降低到之前的5%,并且可實時配適各種手機終端型號、尺寸,極大地提升客戶體驗。
2.超高性能的JPEG2WebP轉碼方案
由于WebP相較于JPEG格式可節省額外25%—34%的數據空間,為了進一步節省網絡流量和數據存儲,目前在業界已經廣泛、大規模的使用了WebP格式。不過,由于算法復雜度很高,WebP的編解碼運算是個沉重的負擔。作為超高性能JPEG2WebP轉碼方案,ThunderImage JPEG2WebP(M4)具有10倍加速比(相較于2U的E5-2680v4)。即用一臺2U的E5-2680v4服務器(配置一張AlveoU200加速卡),采用該方案最高可替換10臺同樣型號CPU的服務器。與此同時服務響應時間縮減9倍,客戶體驗明顯提升。
“在行業內WebP應用的領域非常廣泛,如電子商務、社交媒體、新媒體、視頻媒體都有大量的應用,ThunderImage JPEG2WebP將會有非常驚人的部署量,它也許會改變人們對于圖像處理的認知。”深維科技創始人、CEO樊平如此評價。
3.世界級超高密度算力的JPEG2JPEG縮略圖方案
ThunderImage JPEG2JPEG U50是基于賽靈思Alveo U50加速平臺的最新產品。在相同的物理空間下,1張Alveo U200的空間等于2張Alveo U50的占用空間,此方案將提供最高24倍的加速比,即對于相關業務的服務器集群,用一臺CPU服務器,采用該方案最高可替換24臺同樣型號的CPU服務器。而由于Alveo U50的HBM高帶寬能力,該方案的響應時延縮短為CPU的4%。從數據來看,對于高算力密度的縮略圖生成集群,ThunderImage JPEG2JPEG U50是世界級超高密度算力的解決方案。
據樊平透露,由于三款產品的獨特優勢,深維科技目前已經與6家國內外知名互聯網企業就上述三款新產品達成合作意向,并有多家企業明確表示具有濃厚興趣,正處于合作洽談階段。
圖像處理領域的公認最佳實踐:FPGA異構計算
根據有關數據和研究結果,自2005年以來,尤其是近幾年,摩爾定律逐步加速放緩。而隨著移動互聯網、大數據、5G應用、物聯網、AI應用的飛速發展,數據中心的算力需要也隨之而爆發。
數據中心如何在摩爾定律失效的情況下提升算力,從而滿足日益暴增的業務處理需要,已經成為其面臨的重大挑戰。目前業界主流的算力提升方案無外乎以GPU、FPGA和ASIC為核心的異構計算方案。
由于GPU、FPGA和ASIC各自算力特性不同,因而在處理不同的計算類型、計算場景時擁有各自優勢。GPU屬于馮諾依曼結構,具有高并發、高靈活性的特點,但也存在能耗高、實時性差的缺點。ASIC和FPGA則在能效上略勝一籌,主要因為其體系結構無指令、無需共享內存。ASIC是為了某種特定需求專門定制的芯片,體積小、功耗低、計算性能和效率高,但其算法調整難度極高,適合算法固定、應用規模化的計算場景。
FPGA介于兩者之間,具有低延時、低功耗的特性,且可編程靈活性高、開發周期短,支持后期的調整升級。因此,FPGA具有得天獨厚的優勢,市場空間及潛力巨大,比如圖像處理領域。正是基于這個判斷,深維科技從建立伊始即專注于FPGA領域。深維科技創始人、CEO樊平說:“FPGA異構計算市場將會是一個千億美元級的市場,未來深維科技將持續聚焦,深耕圖像視頻處理、大數據處理和高性能計算等領域。”
編程困難+設計復雜,FPGA應用的“罩門”
盡管FPGA優勢明顯,市場空間巨大,但實際應用卻有相當高的技術門檻:其一,編程困難,鑒于RTL編程復雜低效,HLS設計又不夠成熟,編譯時間漫長且調試困難;其二,硬件系統設計復雜,目前異構計算體系復雜需要定制軟件棧。因此,行業內通常所認知的FPGA應用的開發周期是以“年”計,還要面臨最終產品性能不理想的風險。這都導致很多科技公司對FPGA“望而卻步”。
而深維科技作為“后起之秀”,卻優雅地解決了這兩個難題,在不到一年的時間內,以分別順序成功推出三款圖像加速的顛覆性產品,平均每款產品的研發周期不到3個月。
深維科技:基于Vitis的高層次FPGA設計方法的典范
產品研發速度快,效果好,深維科技是怎么做到的?
樊平認為,原因有三。一是團隊強大EDA及相關技術背景,使得FPGA應用開發舉重若輕;二是自研EDA輔助工具,在極端情況下可發揮關鍵作用;三是依靠團隊的高效組織和昂揚斗志。
以團隊基因而言,深維科技的核心技術成員交叉覆蓋圖像視頻應用算法和FPGA核心技術,團隊多來自于Cadence、IBM、微軟研究院、京微雅格、中科院、復旦微電子等,對行業的理解以及產品工程能力較有優勢,在FPGA芯片架構設計與評估技術、FPGA EDA工具算法、高性能算法等方面具有深厚的積累。
而由于核心團隊對于FPGA芯片架構和EDA工作機制有著深刻的理解,在開發過程中,首先采用基于C/C++語言開發,一方面可以支持更大規模算法,另一方面提升芯片架構的靈活性,讓改動周期縮短;其次,采用自研開發工具,包括FPGA設計工具、調試工具、標準化專用系統設計工具等,保障了產品的性能。
此次XDF大會上,賽靈思FPGA軟件開發副總裁Dan Gibbons在Vitis開發者與生態的專題報告里,以深維科技作為成功案例,詳細介紹了深維科技的產品與技術,高度評價了深維科技的圖像處理產品性能,稱“深維科技很好的示范了基于Vitis的高層次FPGA設計方法”。
賽靈思FPGA軟件開發副總裁Dan Gibbons于XDF2019
“目前來看,我們的研發效率和效果在業內已經處于明顯的領先地位,圖像處理產品已經得到了很多客戶的認可。未來,我們將根據產品計劃,分批次推出更為重磅的視頻處理分析方案、高性能計算方案和大數據方案。”對于新產品、新未來,樊平充滿信心。
在FPGA圖像加速領域,深維科技已經跨入了發展的快車道。未來,能否在該領域持續保持領先優勢,并不斷開拓新領域,我們拭目以待!