訂閱電子報∣ 友善列印字體大小 文章分享-Facebook 文章分享-Plurk 文章分享-Twitter
5nm晶片功耗集體“翻車”,三星台積電誰來背這“鍋”?
獲取產業訊息零時差!立即訂閱電電公會電子報。

2020年底,搭載5nm晶片的智慧手機陸續上市,蘋果、海思、高通相繼推出自家新旗艦產品,看似又是一個手機晶片性能跨越性提高的節點。然而事與願違,從發佈會上的PPT到終端產品上手,實際能耗比都不盡如人意。特別是備受關注的驍龍888,從發佈會後的“秒天秒地”,到小米11上市後論壇上鋪天蓋地的“翻車”帖,也很能說明落差之大。那麼這一代的5nm晶片,到底問題出在哪?
A14:性能擠牙膏,能效開倒車
蘋果A14作為首發5nm制程的晶片,推出之初也伴隨著發熱、降頻的談論。A14 CPU與上一代相同採用了“2大+4小”的架構,但大核史無前例地拉到了3GHz的峰值頻率,相比上代A13提高了13%。雖然CPU實際性能提升不如往年,但這一代A14至少是在能耗上有驚喜。
根據貼吧網友@Howl的Geekbench Pro5測試資料顯示,單核上3GHz的A14比2.66GHz的A13功耗低了接近28%左右,同時單核1597分相比A13的1332分提升近20%。這個成績已經超出了TSMC的N5工藝同性能下功耗降低30%、同功耗下性能提升15%的理論值,顯然蘋果在A14的大核中優化了IPC。雖然A14雙核功耗比A13高6%左右,同樣全核功耗也稍微提高,相比其性能提升完全在合理範圍內。
而A14的問題就出在GPU上。在能夠體現CPU極限性能的GFXBench Manhattan 3.1測試中,根據博主@小扁藍超微提供的資料顯示,處於冰箱環境(為了降低發熱降頻的影響)的A14 GPU平均功耗高達7.33W,峰值達到了8.12W。當然,單純的功耗並不能代表什麼,能效比才是更加體現晶片實力的資料,在高功耗下有對應的高性能也能夠提高能效。
然而,同樣在GFXBench的測試中,A14的峰值性能相比A13提升並沒有達到蘋果PPT上GPU提升30%的效果,除了Manhattan兩項之外,其餘測試項目均只提升5%左右。根據各項測試資料,A14能效相比A13反而普遍下降。要知道,TSMC  N5工藝宣稱的同功耗下性能提升也有15%,即意味著制程工藝帶來的紅利不僅沒有體現,反而還倒退了。
當然,出現如此不尋常的情況,也有人懷疑可能是TSMC N5工藝出現了問題。 ICmasters在分析A14 die shot後發現,這一代N5工藝實際電晶體密度為1.34億/平方毫米,但TSMC官方宣傳其5nm工藝可以做到1.713億個電晶體/平方毫米的密度,A14實際只達到了理論的80%不到。與此同時,從A10到A13,實際電晶體密度基本上是保持在理論值的90%附近,這難免讓人產生TSMC工藝“翻車”的猜測。事實上,A14發佈不久後,從同樣基於TSMC N5工藝的麒麟9000表現來看,似乎也將能效“開倒車”的原因導向TSMC身上。
麒麟9000:堆核心+拉高頻=功耗爆炸?
從這一代麒麟晶片的命名上,能看出與上代995提升之大,事實也確實如此。麒麟9000 CPU部分採用了1+3+4的設計,A77超大核峰值頻率被設定到了3.13GHz;而GPU部分則採用了最新的Mali-G78,直接把Mali GPU允許的最高24核心規則堆滿了。可以認為,華為在目前的生存環境下,已經將能夠堆的料都堆滿了。
不過,堆料所付出的代價必然是功耗“爆炸”。根據視頻博主@極客灣提供的資料,CPU方面,麒麟9000峰值功率達到了5.96W,相比上代995提高了30%,單核性能提升38%,多核性能提升近20%,與A13到A14的提升幅度類似。
同樣,麒麟9000的“翻車點”在於GPU。前面提到麒麟9000的GPU規格高達24核,核心數之多,已經預示著其峰值功耗之高。不出所料,在移動端幾乎最能體現GPU性能的遊戲“光明山脈”中,麒麟9000測出了恐怖的11.1W整機峰值功耗,這已經接近於筆記本的GPU功耗了。
而這並不是極限,在GFXBench Manhattan 3.1測試中,室溫環境下麒麟9000能夠達到122FPS/7.22W,但有部分網友測出141FPS的成績,幾乎達到了A14的冰箱測試水準!不過,麒麟9000受限於Mali-G78架構的能效,達到與A14相同性能下,功耗必然也大幅提高。
總而言之,麒麟9000只能使用落後友商一代的A77架構之下,通過拉高頻達到性能提升,與頻率相近且同架構的高通驍龍865+功耗其實下降了10%-15%。從驍龍865+採用TSMC N7P工藝來看,麒麟9000的CPU部分還算是符合TSMC N5工藝提升的預期。
而比A14“翻車”更嚴重的GPU部分,麒麟9000雖然被認為“堆料太多”,但GPU多核低頻理論上也是提高能效的方法之一。相比於提頻,堆核心帶來的性能提升是更接近于成正比的,目前麒麟9000的實際能效與性能不如堆料的提升幅度大。且從多方資料來看,麒麟9000的個體體質差異巨大,因此同樣不能排除TSMC工藝不穩定的因素。
驍龍888:實測中“唯唯諾諾”,PPT“重拳出擊”
如果單從高通發佈會上的PPT來看,驍龍888無疑是近幾年手機晶片中提升最大的。CPU部分,驍龍888首次採用了Cortex-X1大核,1*X1+3*A78+4*A55的架構,高通宣稱有25%的性能和能效提升,即在功耗不變的情況下,性能提升25%。 GPU升級成Adreno660,高通更是表示性能大幅提升35%,能效提升20%。
然而在PPT上吹過的牛,實測中很快就原形畢露。根據AnandTech的資料顯示,基於SPEC06int的CPU測試中,驍龍888的X1大核平均每瓦能效為13.87,而麒麟9000採用落後一代的A77核心平均每瓦能效也達到了16.14,對比高通自己上一代旗艦驍龍865的18.3每瓦能效更是相差甚遠。
GPU部分同樣引用GFXBench Manhattan 3.1測試資料,驍龍888能夠達到7.67W/118FPS,能效比不如麒麟9000的7.22W/122FPS,GFXBench峰值功耗也超過了9W。
其實從X1大核的能效比資料中就能夠意識到問題所在,理論上能效比能夠獲得大幅提高的X1大核並沒有表現出應有的優勢。與三星推出的5nm Exynos 1080作對比,同樣採用A78架構的中核,驍龍888中核運行在2.42GHz下,基於SPEC06int測試得出平均每瓦能效為18.79,而三星Exynos1080則僅僅提升到2.6GHz後,平均每瓦能效就暴跌到13.69。
X1相比A78本身有近10%的能效加成,而Exynos1080的A78大核與驍龍888的X1頻率均在2.8GHz附近,所以通過對比可以發現,兩者能效差距在18%左右,且能效都偏低。由於驍龍888採用的是與Exynos1080相同的三星5LPE工藝,因此有很大概率,CPU能效低是三星5LPE工藝高頻表現差造成的。至於這次三星5LPE“翻車”程度之嚴重,甚至可以認為TSMC的N5實際上已經是正常表現。
小結:
要注意的是,以上所有“翻車”現象僅僅是出現在極限性能條件下,在日常使用場景中幾乎不會出現,而且個體表現差異巨大,“翻車”還存在一定概率。對於如今的旗艦晶片而言,性能基本上不會成為瓶頸,其實只要手機廠商適度調校處理器調用策略,峰值性能差異完幾乎不會在日常使用中被感受到。
雖然種種測試結果都導向目前5nm工藝非常不成熟,相比7nm時代提升微乎其微,甚至可能因為漏電率高,導致能效比有所下降。不過,這或許也是整個半導體行業所需要面對的現實——制程工藝帶來的性能提升已經越來越小,任何領域的技術都不可能幾十年如一日地高速發展。
近十年由於智慧手機對於晶片性能、體積的需球推動了先進制程的井噴式發展,無論是不斷提高的投入,還是矽材料的物理限制,都無可避免地使先進制程遇到瓶頸,尋求其他的路線。或許可以說是FinFET到了歷史的盡頭,未來可能是GAA的時代;亦或許未來避免不了走上用功耗規模換性能的路線。但是,只要未來智慧手機依然保持如今的升級速度,或有其他對更先進制程的需求爆發,制程發展還將繼續延續下去。

訂閱電子報 友善列印 字體大小:
獲取產業訊息零時差!立即訂閱電電公會電子報。