訂閱電子報∣ 友善列印字體大小 文章分享-Facebook 文章分享-Plurk 文章分享-Twitter
穀歌TPU之後還有高通,人工智慧晶片競賽已經展開
獲取產業訊息零時差!立即訂閱電電公會電子報。

那是 1992 年,LeCun 還供職於貝爾實驗室,這座位於紐約市郊的研發機構舉世聞名。他和一群研究者們共同設計了一種適用於進行深度神經網路計算的晶片 ANNA,用於高效處理需要分析大量資料的複雜任務,但 ANNA 從未投入市場。隨後的二十多年裡,神經網路隨著電腦性能的不斷提升,開始在識別文字、人臉和語音等任務中達到甚至超越了人類水準。但人工智慧還遠沒有達到威脅人類智慧的水準,那些用於特定任務的演算法,在執行其他種類任務的時候,不會產生任何有意義的結果。

儘管如此,今天的神經網路還是在重塑著所有科技公司的面貌,穀歌、Facebook、微軟都在做著自己的改變。LeCun 現在已經成為 Facebook 人工智慧實驗室的主任。在那裡,神經網路被用於識別人臉、標注圖片中的事物、翻譯語言甚至更多。在 25 年後,LeCun 認為市場現在非常需要像 ANNA 這樣的晶片,很快,它們將大量湧現。

穀歌剛剛有了自己的人工智慧晶片 TPU,這種晶片已經廣泛用於穀歌的資料中心,成為其網路帝國的引擎。每台安卓手機的穀歌語音搜索指令都會經由 TPU 處理。這只是晶片業巨大變革的開始,CNBC 等媒體 4 月 20 日 的報導指出,穀歌 TPU 的開發者們正在秘密成立的創業公司 Groq 重新集結,開發類似的人工智慧晶片;而傳統晶片廠商,如英特爾、IBM 和高通也在做著同樣的努力。

穀歌在本月初推出 TPU 時稱:「它是我們的第一塊機器學習晶片。」在穀歌發表的論文中,TPU 在一些任務中的處理速度可達到英偉達 K80 GPU 與英特爾 Haswell CPU 的 15-30 倍。而在功耗測試中,TPU 的效率也比 CPU 和 GPU 高 30-80 倍(當然,作為對比的晶片並不是最新產品)。
 
穀歌 TPU 晶片已經成為其資料中心的重要組成部分
像穀歌、Facebook 和微軟這樣的科技巨頭當然可以把自己的神經網路任務交給常規電腦晶片來處理(如 CPU),但 CPU 是設計用來處理所有類型任務的,這種方式顯得效率很低。當使用特殊設計的晶片進行處理時,神經網路任務會運行得更快,消耗更少的電力。谷歌宣稱隨著 TPU 的應用,它為穀歌節約的成本可以打造另外 15 個資料中心。而隨著穀歌、Facebook 等公司將神經網路應用於手機和 VR 頭盔,為了減少延遲,在個人設備上的小型智慧晶片也變得迫在眉睫了。「在更加高效的專業晶片方面,市場還有很大一片空白,」LeCun 說道。

技術巨頭
在收購了初創公司 Nervana 之後,英特爾正在打造一款機器學習專用晶片。IBM 也是,它正在創建一個可以映射(mirror)神經網路設計的硬體架構。最近,高通已經開始製造執行神經網路的專用晶片,這條消息來自 LeCun,因為 Facebook 正幫助高通開發機器學習相關技術所以他對高通的計畫很瞭解;高通技術部副主席 Jeff Gehlhaar 證實了該計畫,他說:「在原型機研發方面,我們還有很多路要走。」

高通一直在和 Yann LeCun 在 Facebook AI 研究機構的團隊保持合作,共同開發用於即時推理的新型晶片。高通最近宣佈計畫花費 470 億美元收購荷蘭汽車晶片公司 NXP。在收購宣佈之前,NXP 就在致力於解決深度學習和電腦視覺難題,看來高通希望借助收購加強自動駕駛系統的開發。

自動駕駛是深度學習與人工智慧發揮作用的主要領域之一。除此之前,內置晶片有很多其他選擇以與真實世界交互,比如手機和虛擬實境耳機。當前技術發展飛快,我們很快就會看到其他實際應用的出現。

很多公司想把握住這一藍海機遇,比如傳統晶片巨頭英特爾和 IBM。Big Blue 努力在其 Minsky 人工智慧伺服器中把 RISC 晶片和英偉達 GPU 結合起來的同時,其研究團隊也在探索其他晶片架構。IBM Almaden 實驗室探討了其類腦晶片 TrueNorth 的性能,該晶片具備 100 萬個神經元和 2.56 億個突觸。IBM 稱在若干個視覺和語音資料集中,TrueNorth 給出了接近當前最高分類精確度的深度網路。

IBM 研究院類腦計算首席科學家 Dharmendra Modha 在其博文中說道:「類腦計算的目標是在不斷逼近時間、空間和能量的根本限制的情況下,給出可擴展的神經網路基礎(substrate)。」

作為晶片領域最大的玩家,英特爾並沒有止步不前,它也正在根據下一代人工智慧工作需求開發自己的晶片架構。去年,英特爾宣佈其第一個人工智慧專用硬體 Lake Crest(其技術基於 Nervana)將在 2017 年上半年推出,並在稍後接著推出 Knights Mill,它是 Xeon Phi 聯合處理器架構的下一個反覆運算。

英偉達已成為人工智慧硬體領域的主力軍之一。在穀歌、Facebook 等公司能夠使用神經網路翻譯語言之前,他們必須首先用特殊任務訓練神經網路,給神經網路輸入現有的大量翻譯資料集。英偉達製造了可以加快這一訓練進程的 GPU 晶片。LeCun 說,在訓練方面,GPU 通常考慮的是市場,尤其是英偉達 GPU。但是 Farabet 的出現也許表明,英偉達正和高通一樣,也在探索一旦接受訓練就可運行神經網路的晶片。

GPU 最初的設計初衷並非人工智慧,而是圖形繪製。但是大約 5 年前,穀歌、Facebook 等公司開始使用 GPU 訓練神經網路,僅僅因為 GPU 是現有的最佳選擇。LeCun 相信 GPU 可以持續發揮這一作用,他說,現在程式師和公司對 GPU 相當熟悉,他們具備使用 GPU 的所有工具;GPU 很難被替代,因為替代它需要換掉全部(整個生態系統)。但是他也認為將會出現一種新型晶片,從資料中心和消費設備兩個方面,極大地改變大型公司運行神經網路的方式,從而,從手機到智慧割草機再到真空吸塵器的一切也都將會改變。

正如穀歌 TPU 展示的,專用 AI 晶片可以將資料中心的運行效率提高到一個新的層次,特別是對於那些需要進行圖像識別的伺服器。在執行神經網路任務時,它們消耗更少的電力,發熱更小。「如果你不想讓一個池塘沸騰,你就需要特殊設計的硬體,」LeCun 說。

與此同時,隨著 VR 和 AR 技術的發展,手機與頭戴設備也需要同樣的晶片。Facebook 上周曾展示了它們的新型增強現實工具,而這種設備需要神經網路來對周圍環境進行識別。但增強現實系統的任務不能基於資料中心——傳送資料需要時間,延遲會破壞用戶體驗。正如 Facebook 首席技術官 Mike Schroepfer 所解釋的,Facebook 目前正在使用 GPU 和另一種被稱為數位信號晶片的設備處理這些任務。但從長遠來看,這些設備必須使用全新類型的晶片。

現在,需求已經出現,晶片公司正在爭相佔領新的市場。

訂閱電子報 友善列印 字體大小:
獲取產業訊息零時差!立即訂閱電電公會電子報。