首頁|台灣區電機電子工業同業公會

AI應用場景的廣闊性，讓如今的CPU、GPU、FPGA以及ASIC幾乎都能從中分得一席之地。但隨著AI演算法的持續演進，數值精度的選擇也會呈現出更加多樣化的趨勢，這也為現有的AI處理器架構提出了新的挑戰。若是不能與時俱進，緊跟演算法技術更迭的腳步，最終只會落得被淘汰的終局。

要在AI晶片領域先發制人，硬體架構的創新必然最直截了當的途徑。為此，Achronix近日正式對外公佈了全新的“FPGA+”技術，將ASIC的優勢屬性融合在FPGA當中，令其即擁有如同ASIC那般的低功耗和低成本特性，又具備更簡化設計的靈活性和增強功能，在各項性能上都遠超傳統FPGA的水準。

未來五年CAGR達38.4% 市場需求促FPGA與ASIC加速融合
如果拋去成本比拼性能，在CPU、GPU、FPGA以及ASIC四者之間， FPGA可以算是綜合性能相對占優的解決方案。也正因此，市場上很多類型的AI應用都樂於採用FPGA來做晶片開發。據Semico Research 於2019年5月發佈的資料包告顯示，2018年，FPGA在AI應用市場創造了10億美元的收入，從2019到2023年未，CAGR將保持在38.4%，2023年市場銷售額有望超過50億美元。

不過，這一切都要以FPGA不斷加速創新為前提，以求在AI市場用更大的差異化優勢來與CPU、GPU和ASIC抗衡。作為FPGA技術的領先企業，Achronix本次推出的Speedster7t系列，就創新性的在FPGA中融合了ASIC的技術，能夠提供相比以往FPGA更強勢的性能。

Achronix Semiconductor總裁兼首席執行官Robert Blake在產品發佈會上表示：“我們最新發佈的Achronix Speedster7t是靈活的FPGA技術與ASIC核心效率的融合，它提供了一個全新的‘FPGA+’晶片品類，這代表了我們建立在四個架構代系的硬體和軟體發展基礎上的創新和積澱，以及與客戶之間的密切合作。”

這種融合會否是未來AI晶片的演變趨勢?針對這個問題，Robert表示：“目前，市場需要ASIC技術中擁有一些可程式設計的屬性，而對FPGA這種可程式設計器件，也需要加入一些ASIC的低功耗等屬性。所以未來，我們所看到的可能會向既不是傳統的FPGA，又不是傳統的ASIC方向去演變，這個市場會不斷的改變並伴隨更多的增長。對Achronix公司來說，我們既有IP，同時也有器件，如果客戶做ASIC晶片需要有一小部分程式設計的屬性，我們可以提供，想要FPGA擁有ASIC性能，我們也能夠提供，這是我們很大的一個優勢。”

AI晶片如何同時提升算力和速度?
任何一款AI晶片，一旦被拿來與同類競品相比對，算力和速度必然是首當其衝。但光有算力和速度顯然是不夠的，隨著AI晶片越來越多的強調存算一體化，尤其對於邊緣計算這類端側應用，存儲和計算若能同時進行，無疑能夠極大的降低資料延時，對提高晶片的整體效率大有裨益。

Speedster7t的MLP就是為此而生，Robert告訴記者：“Speedster7t的核心採用了全新高度可配置的計算密集型單元模組——MLP，即機器學習處理器單元。每個MLP中擁有大規模的可程式設計計算單元平行陣列，能夠提供業界最高的基於FPGA的計算密度，並可以支援4到24位的整點格式和高效浮點模式。一個MLP可以同時實現32個乘法，比傳統FPGA中DSP的效率要高5倍。”

高算力必然也需要大頻寬的支援，據Robert介紹，Speedster7t器件是目前唯一支持GDDR6記憶體的FPGA，每個GDDR6存儲控制器都能夠支援512Gbps的頻寬。整個Speedster7t器件中有多達8個GDDR6的控制器，可以支援4Tbps的GDDR6累加頻寬，並以很小的成本就可以提供與基於HBM的FPGA等效存儲頻寬。

這對於速度也會有很大提升，Speedster7t還有72個高性能的SerDes，可以達到1到112 Gbps的速度，Robert強調這是經過矽片實際驗證得出的結果。而且，還帶有前向糾錯(FEC)的硬體400G乙太網MAC，支援4x 100G和8x 50G的配置，每個控制器有8個或16個通道的硬體PCI Express Gen5控制器。為了應對400G乙太網資料的處理需求，Achronix採用的是將資料進行分割並行處理的方法。

除了用高算力的MLP和大頻寬的GDDR6來提升效率之外，二維片上網路NOC的應用，也是Achronix從晶片內部來突破速度極限的關鍵點。據悉，NOC主要就是被用來提升晶片內部資料流程通的速度，這種方式在傳統的FPGA線路佈局上做出了極大的改變，它是採用片上網路的模式，類似3D結構的高速公路，通道之間的資料能夠快速流通且互不影響。

具體來講，Robert Blake解釋到：“專用二維NOC極大地簡化了高速資料移動，確保資料流程可以輕鬆地定向到整個FPGA結構中的任何自訂處理引擎。其中每一條通道，我們都是採用了256個Byte的走線，同時可以跑2GHz的速度。所以，每一條通道我們會有512G的頻寬，但是我們每一個都是來回且相向的。所以，相向的話，乘以為倍數我們能夠達到1TB的速度。但如果採用傳統的FPGA走線，如果有200多條線的話，每一條線要達到2GHz的速度是不可能的，最多只能夠達到300MHz。”

CPU、GPU、FPGA和ASIC 究竟誰會成為AI處理器的主流?
從AI晶片市場爆發之日起，業界一直對CPU、GPU、FPGA、ASIC誰將會是未來AI處理器的主流爭議不斷。而這次，Achronix創新性的將FPGA和ASIC的優勢融為一體，顯著降低功耗和成本的同時，也能提供基於FPGA的可程式設計能力，這是否也意味著更多的融合方案會逐漸取代單一的AI處理器架構，成為市場的主流?

對於這個問題，Robert認為：“每一類晶片都有其技術長處，並且AI晶片的市場在不斷增長，所有的晶片類型都會從中受益，所以我認為未來會是一個多種方案並存的局面。就FPGA方面來講，我們比較看好的應用會是語音、網路加速以及機器學習，這是我們器件方面的主要應用;如果是IP產品的話，我們認為主要還是5G、無線以及汽車ADAS這類市場，以及在記憶體內部也會有需要加入運算的功能，讓器件更靈活，這樣就可能需要一些程式設計的能力。”

由此看來，FPGA未來在AI領域的市場前景仍是相當可觀的。更何況，Achronix的FPGA如今已經具備了“FPGA+ASIC”的雙重優勢，想必這在接下來的AI晶片市場中能夠保持非常高的競爭力。畢竟，差異化是一個很大的優勢，相信“FPGA+”的這種差異化，也會引發AI晶片技術的又一輪創新熱潮，並持續引領AI處理器向多方案融合、優勢互通的方向演變。