訂閱電子報∣ 友善列印字體大小 文章分享-Facebook 文章分享-Plurk 文章分享-Twitter
光電交接拉開序幕 生成式AI驅動HPC I/O革命
新電子黃繼寬
獲取產業訊息零時差!立即訂閱電電公會電子報。

生成式AI創造出巨大的算力需求,使得晶片業者跟雲端服務供應商(CSP)不只要開發出運算效能更強大的處理器,在I / O、互連技術的性能方面,也必須做出對應的升級。伺服器內部互連光化的時代,亦因而揭開序幕。

生成式AI的發展,脫離不了運算能力與資料這兩大要素,且運算能力跟資料之間,本就是互相依存的關係。隨著處理器的運算能力提升,將資料提供給處理器的速度也必須跟上,否則就會造成處理器閒置,拖累整個系統的效能表現。

根據Meta所做的研究 , 目前其AI叢集(Cluster)在進行模型訓練跟推論時,GPU大約有30%的時間浪費在等待資料上,因為資料中心的網路來不及把資料送給GPU處理。由此就可看出資料傳送能力對系統效能,可以產生多大的影響。

雖然Meta的研究對象是複雜的AI叢集,但不管是單一台伺服器或整個機櫃,所面臨的挑戰都是一樣的:隨著處理器的運算能力增加 , 如何即時地將資料送給處理器,變成一個越來越難克服的技術挑戰,特別是在不更換傳輸介質的前提下。

高速SerDes撞上物理高牆

在高速訊號的世界裡,串列/解串列(SerDes)器能跑多快,是決定了一條訊號通道能在單位時間內傳送多少資料的決定性因素。然而,隨著SerDes速度增加,SerDes的功耗也跟著上升,因此,除了提升SerDes的速度,業界也在發展效率更好的編碼方式,例如從NRZ編碼升級為PAM4,甚至更複雜的PAM6、PAM8,讓每一個符號可以代表更多位元(圖1)。

圖1 從NRZ轉換成PAM4訊號,固然提升了資料傳輸的能力,但也導致位元錯誤的風險增加

然而,採用更先進的編碼技術,必須付出位元錯誤率(Bit Error Rate, BER)增加的代價。因為每一個符號可以代表更多位元,也意味著電壓的位準要求必須更嚴格,但電氣訊號經過線纜、連接器時,有太多物理因素可能導致電壓飄移,進而引發位元錯誤。因此,即便採用更先進的編碼機制,高速訊號技術的發展,最終還是撞上了物理的高牆。此外,高頻電氣訊號在導體中傳輸,也會面臨更大的損失,如果不改用新的傳輸介質,訊號跑不遠的問題便無法解決。

因此,對於需要大量頻寬的伺服器與高性能運算系統而言,將高速訊號路徑與一般訊號路徑分流,而不是讓所有線路都跑在主機板上,已經是非常常見的作法。藉由使用材料特性更好的高架線纜(Flyover)與專門針對高速訊號設計的連接器,設備製造商一方面可以控制印刷電路板的成本,同時又能滿足高速介面對電氣特性的嚴格要求。

但即便如此,只要是基於電氣訊號實現的介面,隨著頻寬不斷上升,終究還是會遇上物理法則設下的限制。英特爾(Intel)早在多年之前就開始投入矽光子(Silicon Photonics)技術研究,就是希望在電氣訊號介面的大限來臨前,做好另一手準備;台積電跟日月光共同號召台灣半導體相關業者組成矽光子聯盟,並發展光學共同封裝(CPO)技術,也是為了同樣目的而展開的布局。

矽光子將是大勢所趨 光電交接卻非一朝一夕

根據台積電的CPO技術發展路線圖(圖2),2025年該公司將開始利用COUPE生產OSFP模組,預期要到2026年之後,才會開始將矽光元件配置到交換器晶片的載板、XPU的矽中介層上,實現真正的CPO。屆時,晶片對外連線的通道頻寬將可輕鬆達到Tb/s等級,是目前主流SerDes的數倍到十倍,甚至百倍不等。

圖2 台積電光學共同封裝技術發展路線圖

這就是矽光子的威力,也是整個業界最終都會向矽光子轉移的根本原因。只要能順利過渡到矽光子,晶片的I/O性能就可以得到數倍以上的提升,在可預期的未來,都不會再有頻寬不足的壓力。

但從台積電的時程規劃,也不難看出要讓晶片I/O光化,不是件容易的事情。即便台積電能展現其一貫的執行力,如期推出產品,其他配套方案能不能在兩年內同步跟上,就是一個問題。因此,產業標準組織在這段期間,一定要扮演更積極主動的角色,才能讓整個生態系一起朝光化的時代邁進。例如負責主導PCI Express標準的PCI-SIG,就正在加速制定Optical PCIe標準,預計在2025年對外公布。

退一步而言,在生成式AI風起雲湧,所有晶片開發者都以每年推出一代新產品的快節奏向前走時,如何滿足晶片客戶2025~2026年這段等待期的I/O升級需求,就是一個必須設法解答的問題。或許,將SerDes的連接器直接配置在晶片的封裝基板上,讓晶片的高速訊號一離開晶片便改走高架線路,完全避開在主板上傳輸,會是一個頗具吸引力的過渡方案。至少,晶片開發者在等待CPO技術量產的時期,還有機會將I/O頻寬從112Gb/s升級到224Gb/s,甚至更高。

2025將成光電交接元年

2025年伺服器跟高速運算系統內部使用的互連技術,顯然還沒有大舉光化的條件,畢竟相關配套還沒有真正到位。但隨著台積電帶頭引領產業朝矽光邁進,光電交接必將成為2025年高速介面領域的一個主要議題,特別是以伺服器跟高速運算設備為主要應用市場的業者,都必須為此作好準備。從產業標準的制定到相關配套技術的研發,2025年肯定會是非常忙碌的一年。

訂閱電子報 友善列印 字體大小:
獲取產業訊息零時差!立即訂閱電電公會電子報。