訂閱電子報∣ 友善列印字體大小 文章分享-Facebook 文章分享-Plurk 文章分享-Twitter
FPGA“能耗比”優於GPU 人才“掣肘”致GPU先普及
獲取產業訊息零時差!立即訂閱電電公會電子報。
今年全民熱炒的AlphaGo人機圍棋大戰乃至近來更加亮眼的AlphaGoZero 100:0擊敗AlphaGo,讓人們豁然看到一個嶄新的巨大應用需求:人工智慧。人工智慧不僅在FPGA的傳統應用擴散,諸如通信、工業、軍事、航空航太、消費領域,也在快速向新興應用領域滲透,諸如物聯網IoT、自動駕駛、智慧城市、智慧製造、智慧型機器人等;同時,人工智慧對高、中、低密度FPGA市場都有極致的市場放大效應。

可見,人工智慧對發展到現階段的FPGA來說,有著不同以往的市場機遇。廣東高雲半導體科技股份有限公司(以下簡稱“高雲”)工程副總裁王添平表示,FPGA自發明以來,經過30年的發展,經歷過構架、工藝、封裝以及集成高性能模組的多次突破,成為很多領域不可或缺的重要核心晶片,在通信、工業、醫療、軍事、航空航太甚至消費領域扮演著重要角色。然而,看看近年來幾家主要FPGA廠商的財務報表則興奮不起來,某排名靠前的廠商銷售出貨量每年增加較多,但實際產生的銷售額增長卻非常有限,而某些排在後面的老廠則日子過得不順暢。在此發展瓶頸下,人工智慧已爆發的需求或將要爆發的潛在需求大大拓寬了FPGA的應用領域,給國產FPGA成長和突圍真正帶來了機遇。

“推動AI領域大幅增長的關鍵是對於技術的應用。基於FPGA實現的ANN、BNN和CNN演算法將發揮最為重要的作用。介面標準必須變得更快、更智慧,如此就可以將發送到雲端進行推理的資料量降到最低。”萊迪思半導體市場總監Deepak Boppana表示,“AI是一個不斷發展的領域,業界正在積極研究下一代網路架構,包括最前沿的技術,如網路邊緣自主學習。在可預見的將來,FPGA將繼續在AI演算法的設計和部署中發揮關鍵作用。”

上海安路資訊科技有限公司(以下簡稱“安路科技”)市場與應用部副總經理陳利光稱,人工智慧硬體的核心是大規模平行計算和並行處理,而FPGA晶片天生具有三大特點:(1)高速並行運算陣列;(2)分散式存儲單元;(3)可重構計算。這三大特點和人工智慧對硬體的高要求不謀而和,可見人工智慧的到來給FPGA提供了歷史性機遇。

人工智慧按照應用場景,可以分為雲端和終端兩大類。深圳市紫光同創電子有限公司(以下簡稱“紫光同創”)市場行銷中心總經理包朝偉表示,雲端主要指後臺伺服器,包括公有雲、私有雲和資料中心等,終端主要是指汽車、安防、機器人、AR/VR等各種應用。目前,FPGA憑藉其高速並行加速計算能力,已經成功應用於雲端伺服器;而FPGA在終端產品上還處於方案或樣機階段,尚未形成量產規模。

從終端應用來看,AI將率先在汽車和安防應用。陳利光透露,對於汽車來說,GPU之類的器件很難通過嚴格的汽車電子標準認證。在安防智慧終端機方面,現在已經看到很多FPGA需求,在功耗、靈活性、性能方面FPGA可以實現最佳平衡。另外,AR/VR、音箱方面也會有些需求。

FPGA必將受益於人工智慧的崛起,然而目前受益于人工智慧應用的晶片類型除了FPGA,還有GPU和ASIC(包括TPU、NPU、VPU和BPU)。包朝偉對這幾類晶片(CPU,GPU,FPGA,ASIC)做了優劣勢對比:“CPU是流水線架構頻率較高,但並行運算速度較慢,整體運算效率較低,不適用於AI;GPU是介於CPU和FPGA之間的產品,運算單元顆粒較大,且開發相對容易,處理運算速度快、可適用於AI演算法但能耗比不好;FPGA開發難度大,但單元顆粒小,平行計算能力非常強,很好地滿足了AI應用對平行計算能力的高要求,同時在功耗上也要比GPU更出色;ASIC在性能、功耗和體積上都有優勢,但目前演算法反覆運算太快,其存在ASIC晶片定制開發週期長、晶片靈活性低等不足,因此近幾年難以趕上GPU和FPGA。”

由上述可見,當下最適用於AI的仍是GPU和FPGA。“二者雖各有優劣,但從性能與功耗的綜合對比(能耗比)來看,FPGA要比GPU更出色。”包朝偉認為,從目前業界最新研究來看,對於實現高性能的人工智慧演算法,FPGA與GPU相比,除了能耗比更好外,FPGA還能夠做到比GPU的系統性能更高,這讓FPGA在AI高性能計算領域獲得了更多的青睞和投入。

萊迪思Deepak Boppana也表示,FPGA的主要優勢之一是在網路邊緣(嵌入式/移動系統中)進行“推理”時,功耗要比使用GPU低得多。萊迪思FPGA針對低功耗(功耗低於1瓦)、小尺寸、低成本進行了優化,這些都是網路邊緣處理應用所需的關鍵特性。

陳利光同樣表示,FPGA的能耗比優於GPU。他分析稱,GPU裡面有數千個小核心,它同時運行最多數十萬個小程式,大多數程式會因為等待訪存而卡住,真正在小GPU上執行的程式只有數千個,管理和組織這數十萬個不受限制的小程式所付出的矽片面積代價和記憶體頻寬的代價,是GPU低效的根源。FPGA的性能功耗比顯著高於GPU。

陳利光還稱,相較於GPU只能處理運算,FPGA能以更快速的速度一次處理所有與AI相關的資訊。FPGA的處理單元是million級,可以做到真正並行運算,可程式設計性又保證搭建流水線靈活,因此運算速度快,資料訪問延遲低,適合inference的即時決策需求。而以TPU、NPU為代表的ASIC晶片類型,目前發展不會那麼快。陳利光坦言,人工智慧演算法不斷演化甚至顛覆的特點,決定了TPU方案將面臨“跟不上演算法演化速度而需要頻繁重新開發”的問題,因此很長時間內不適合大規模市場化應用。

整體來看,相比於GPU,FPGA的核心優勢是即時性、靈活性、海量並行處理能力。而相比於TPU,FPGA的核心優勢是可程式設計性和靈活性。不過記者也看到,FPGA雖然優勢明顯,但其開發難度大仍是目前很大的挑戰。“現在行業內懂得C++等高層次語言的工程師很多,但懂得FPGA HDL硬體開發語言的人才很少,所以FPGA的普及遠遠不及GPU那麼快,這是FPGA方案應用推廣存在的最大障礙。”包朝偉表示。

更有受訪者透露,今年中國BAT大公司和眾多AI創業公司,都在嘗試用FPGA來做人工智慧方案。從人才的流動來看,目前FPGA在後臺伺服器的應用價值正在凸現出來,所以現在FPGA開發人員比較搶手,甚至部分技術專家人才的年薪已接近百萬。

總而言之,人工智慧成為科技發展新的風口,給FPGA帶來前所未有的發展機遇。同GPU和ASIC相比,FPGA海量平行計算能力和可靈活程式設計特性跟人工智慧對硬體的需求不謀而合,然而目前因相應開發人才的短缺導致其普及速度不及GPU,這也是FPGA廠商需要突破的方向。(責編:振鵬)
訂閱電子報 友善列印 字體大小:
獲取產業訊息零時差!立即訂閱電電公會電子報。