訂閱電子報∣ 友善列印字體大小 文章分享-Facebook 文章分享-Plurk 文章分享-Twitter
人工智慧歷經60年仍未普及 運算效能成重要挑戰
獲取產業訊息零時差!立即訂閱電電公會電子報。
人工智慧(Artificial Intelligence, AI)無疑是科技圈近來最火爆的話題,不過對於AI這個提出已經超過60年的概念,能否在第三波浪潮中解決演算法、計算效率、資料等問題實現普及成為了業界關注的焦點。為加速人工智慧的落地與普及,我們看到谷歌、英偉達、英特爾、高通等巨頭紛紛從處理器入手,解決重要的計算效率問題。當然,為解決計算效率問題也給晶片IP授權商帶來了機會與挑戰。那麼,IP授權商如何加速人工智慧的普及?

歷經60多年 人工智慧為何仍未普及?
人工智慧在經歷兩次浪潮後最終歸於沉寂,並且人們的態度也一直在兩極反轉,有人稱其為人類文明耀眼未來的預言,也有人把其當作技術瘋子的狂想。對此,CEVA分部行銷總監Yair Siegel在接受《華強電子》記者採訪時表示:“就AI的夢想而言,它們距離模仿人腦功能仍然非常遙遠。”
 
CEVA分部行銷總監Yair Siegel
即便距離AI夢想還遙遠,2012年之前關於人工智慧的兩極化觀點也還同時存在,但2015年之後,人工智慧又迎來了第三次浪潮。Cadence亞太區IP業務銷售總監陳會馨女士接受採訪時表示:“人工智慧的實現需要處理器有很強的運算能力,但人工智慧提出的時候晶片行業剛剛起步,積體電路也還未到大規模的狀態,硬體的運算能力遠遠不能滿足人工智慧的需求。這幾年人工智慧再次受到關注,其中重要的原因就是硬體載體的運算能力有了飛速的提升。”Yair Siegel補充到:“業界研究人工智慧和機器學習已有多年時間,最近數年中,在稱為神經網路的學術演算法研究領域取得了重大突破。這些用於神經網路的全新演算法可以更好地模仿人腦學習和取得結論的能力。2016年穀歌的DeepMind AlphaGo深度神經網路專案在中國圍棋比賽中打敗了人類圍棋冠軍李世石,也可能是這項技術一個很好的轉捩點。同時,我們也看到了許多其它的神經網路和深度學習技術能夠實現目標識別、語音辨識和語言理解等人工智慧功能。”
 
Cadence亞太區IP業務銷售總監陳會馨
人工智慧普及三大核心要素 運算效能等成IP授權商重要挑戰
“人工智慧雖然沒有達到普及的程度,但現在正在對世界科技格局產生重要影響。影響人工智慧發展的核心要素有三個,一、深度學習演算法的提出;二、移動互聯網產生足夠的大資料;三、計算能力的大幅度提高。隨著演算法、計算能力和大資料這三大人工智慧要素的發展,人工智慧範式遷移已現端倪,技術和產業兩個維度的‘奇點時刻’正在臨近。” Arm戰略聯盟業務發展總監金勇斌如此總結人工智慧普及的三大核心要素。
 
Arm戰略聯盟業務發展總監金勇斌
金勇斌進一步表示,影響人工智慧普及的三大核心要素相互影響,相互促進。具體來說,計算效率方面,人工智慧的普及需要將智慧推進到邊緣和終端設備中,與雲計算不同,邊緣和終端設備晶片對功耗特別敏感。資料方面,無處不在的智慧節點採集的資料是分散的多樣的,形成的大資料是無標籤的,需要邊緣智慧物聯網設備處理標籤資料,處理標籤後的資料才能進行分析、學習。現有的處理器基本框架結構不是為人工智慧所設計的,應用受到很多限制,所以越來越多的廠商認為需要新的處理器來滿足深度學習技術進而實現人工智慧。

陳會馨就表示:“深度學習的晶片是一個全新的設計架構,和以往的網路或AP等技術不一樣,如何在深度學習的晶片中給IC設計的廠商一些特殊介面的IP實際上既是機遇也是挑戰。具體來說,為了讓深度學習的設備達到一個很好的能效比,處理器中需要引入新的IP。另外,以往的處理器中的記憶體介面就是關注的焦點,對於深度學習的晶片來說,大家希望有更高頻寬的記憶體介面來支撐整個晶片計算的吞吐,因此記憶體介面的瓶頸在深度學習的晶片中會更加突出。”

金勇斌認為,面對人工智慧IP授權商面臨三大挑戰,首先從計算效能看,需要增加更多計算能力到系統級晶片(SoC)上,並考慮如何在複雜運算環境下降低成本與功耗,使得在邊緣和終端的智慧設備擁有高效的人工智慧任務處理能力,同時具備靈活性和低功耗的特點。其次從安全性角度看,數以億萬計的設備聯網需要從IP與標準的角度就考慮確保資料從感測器到伺服器的安全。最後從通用性角度看,人工智慧的節點計算能力提高之後,無處不在的智慧設備使得人工智慧場景變得碎片化,智慧節點收集的資料結構化和標準化之後,才能供機器學習,進一步處理分析使用。

Yair Siegel也強調高效能和靈活性方面的挑戰。他表示,今天深度學習演算法需要結合大量計算和大量資料使用,為了實現大眾市場使用,這項技術必需具有高能效,以便用於電池供電設備中。此外,深度學習技術仍然在快速演進和改進,任何IP解決方法必須足夠靈活,以便在產品生命週期內進行技術的更新,並且需要實現靈活的程式設計和易於使用的工具,縮短從研發到生產的過程。而且,它必須具有應對業界不斷發展的新標準、新特性和新功能的能力。

面對效能與運算效率等挑戰 IP授權商各有應對之道
至此,我們不難發現高效能、安全性、靈活性、通用性等都是IP廠商推應對深度學習處理器或者說人工智慧商機需要解決的挑戰。作為全球重要的IP授商,它們如何應對?陳會馨介紹:“Cadence針對深度學習晶片已經有了四年的研發和儲備,今年五月份推出了一款獨立完整的神經網路DSP —Cadence Tensilica Vision C5,面向對神經網路計算能力有極高要求的智慧視覺設備。針對自動駕駛、監控安防、無人機、機器人和移動/可穿戴設備應用,Vision C5 DSP 1TMAC/s的計算能力完全能夠勝任目前終端設備的CNN的計算任務,這款產品的推出對神經網路處理器市場格局來說將產生很大的變化,後續我們也將根據市場的回饋來提供滿足深度學習晶片頻寬需求的產品。”

同樣推出DSP IP的還有CEVA,Yair Siegel表示:“第一波人工智慧演算法研究主要使用GPU是因為它們是現成的而且已經廣泛用於離線進行的訓練部分。然而進入開發和生產消費類產品需要更高能效和更高性能的解決方案。多年來CEVA一直開發用於電腦視覺、語音和深度學習的DSP IP ,CEVA-XM 系列視覺DSP內核連同CEVA深度神經網路(CDNN)工具套件,不僅能夠實現低功耗和高效的性價比,滿足大眾市場設備的要求,還能讓產品快速的從研發走向生產。CDNN套件可以應對嵌入式挑戰,比如降低資料頻寬和處理記憶體傳送,並以軟體更新來靈活的應對技術創新,實現各種產品的可擴展性。”

Arm則是在今年專為人工智慧推出全新的DynamIQ技術。金勇斌介紹,DynamIQ技術將為今後所有新的Cortex-A系列處理器帶來全新的特性和功能,包括:1、針對機器學習(ML)和人工智慧的全新處理器指令集,第一代採用DynamIQ技術的Cortex-A系列處理器在優化應用後,可實現比基於Cortex-A73的設備高50倍的人工智慧性能,並最多可提升10倍CPU與SoC上指定硬體加速器之間的反應速度。2、增強的多核靈活性,SoC設計者可以在單個群集中最多部署8個核,每一個核都可以有各自不同的性能特性。這些先進的能力會為機器學習和人工智慧應用帶來更快的回應速度。全新設計的記憶體子系統也將實現更快的資料讀取和全新的節能特性。3、在嚴苛的熱限制下實現更高的性能,通過對每一個處理器進行獨立的頻率控制,高效地在不同任務間切換最合適的處理器。4、更安全的自動控制系統,DynamIQ技術為ADAS解決方案帶來更快的回應速度,並能增強安全性,確保合作夥伴能夠設計ASIL-D合規系統,即使在故障情況下仍然能夠安全運行。(責編:振鵬)
訂閱電子報 友善列印 字體大小:
獲取產業訊息零時差!立即訂閱電電公會電子報。