訂閱電子報∣ 友善列印字體大小 文章分享-Facebook 文章分享-Plurk 文章分享-Twitter
光子傳輸時代來臨 CPO全力應援AI高速運算
68吳心予
獲取產業訊息零時差!立即訂閱電電公會電子報。

生成式人工智慧(AI)應用爆發,規模不斷擴大的大型語言模型(LLM)帶動資料中心處理的數據量高速成長,亟需增加傳輸速度並解決散熱問題。面對資料傳輸速度的瓶頸,業界將目光轉向光子傳輸技術,期待光學元件在光學共同封裝(CPO)的技術整合下,讓數據傳輸更快且更節能。

CPO相較傳統的可插拔式光收發模組,在效能與尺寸等方面更有優勢。可插拔式光收發模組透過機械製程整合光收發相關元件,並安裝在基板外緣,與電子元件的距離較遠,因此訊號傳輸較容易耗損及延遲。CPO則透過半導體製程將光子傳輸相關元件,直接封裝在電子元件附近,不僅縮小晶片尺寸,更能減少傳輸的延遲與耗能。同時CPO若是進入量產,其成本可望大幅降低。然而CPO面對光學模組與半導體技術的跨領域整合,需要克服結構設計、電路/光路設計與故障分析等挑戰。

CPO市場可期

CPO作為有效加快資料傳輸的技術,根據IDTechEx的分析,每個AI加速器通常採用一個光子積體電路(PIC),來滿足運算中高速處理資料,以及資料傳輸的需求。IDTechEx預期AI系統的應用在CPO市場的占比將持續提升,整體CPO市場規模在2035年將超過12億美元,2025~2035年的CAGR可能達到28.9%(圖1)。

圖1 2025~2035年CPO市場規模預估

台灣半導體龍頭台積電即在CoWoS封裝技術的基礎下,於2024年4月的北美技術論壇中,提出CPO技術的發展藍圖。台積電預計將3D光學引擎製作成緊湊通用型光子引擎(Compact Universal Photonic Engine, COUPE),並在2026年整合COUPE與交換器(Switch),推出CPO產品。業界人士表示,推測台積電希望在兩年內協助客戶推出採用矽光子的產品,以及五年內推出CPO產品。是否會提早採用CPO技術,則依照技術的成熟度評估。

CPO優勢十足

Ansys首席應用工程師陳奕豪(圖2)提及, CPO得益於越來越成熟的封裝技術,2.5D 及3D封裝技術,都有助於整合矽光子與電子晶片讓半導體產業進一步投入CPO技術的開發。CPO整合矽光子與電子晶片,或是三五族半導體與電子晶片,資料透過光傳輸,大幅提升資料傳輸效率。

圖2 Ansys首席應用工程師陳奕豪

採用光子傳輸資料,可以解決電子傳輸的限制。中山大學光電工程學系教授洪勇智(圖3)說明,矽光子在CPO裡面是I/O,負責對外通訊。在晶片之間採用光通訊傳輸,才能將2nm、3nm等先進製程晶片的高效能優勢發揮到極致。加上在高算力需求的AI應用中,需要並聯多顆CPU與GPU來平行處理資料。多顆處理器進行平行運算時,資料傳輸的速度至關重要,也要解決高速傳輸產生的散熱問題。

圖3 中山大學光電工程學系教授洪勇智

電子傳輸不僅速度較慢,較大的功耗容易導致設備過熱。光通訊則具備低功耗、傳輸速度快的優勢,因此CPU與GPU透過CPO模組整合PIC、電子積體電路(EIC)與記憶體,模組之間也使用光通訊傳輸資料,即可有效突破AI大規模運算下的資料傳輸瓶頸。

光子傳輸除了輔助A I運算,洪勇智表示,光是快速移動的類比訊號,在高速運算或大量的AI模型訓練時,有助於省電。近期產業對於矽光子用於運算熱烈討論,未來處理器可能不是CPU,而是一個光通訊處理器,裡面的訊號都使用光子傳輸,只有記憶體使用電訊號。因為光訊號無法停止,而記憶體只能儲存電訊號。

耦合挑戰待克服

CPO技術必須克服採用半導體製程帶來的挑戰,首先需要找到PIC、EIC異質整合的最佳解。陳奕豪解釋,CPO技術的第一個難題,是PIC的設計需要達到效能良好、實現800G以上的傳輸速度,以及對溫度的耐受度更高的目標。其次,EIC與PIC的設計會互相影響訊號傳輸的響應,因此設計需要考量整個晶片的運作。第三點則是熱管理,ASIC的運作會產生不少熱能,而雷射對溫度敏感。PIC如果受熱,傳輸頻率可能改變,導致調變速度下降,資料傳輸速度減慢,甚至漏掉封包。

另外,光纖與PIC的耦合面臨對準的挑戰。矽光子是單模的波導跟光纖,所以尺寸比較小,光纖難以對準IC。從結構完整性的方向分析,CPO晶片如果過熱,載板可能因為熱應力而改變形狀,導致晶片翹曲,進而影響光纖與PIC耦合。訊號傳輸方面,CPO晶片的光路與電路的傳輸頻道會互相影響,需要透過光路與電路的協同設計來避免上述問題。

測試複雜度上升

宜特科技故障分析工程處處長沈士雄博士(圖4)認為,2024年AI的應用讓光通訊發酵,因為AI運算的資料量非常龐大,在資料中心支援大量算力的情況下,資料中心的散熱與節能便成為全新的課題。傳統電子傳輸的金屬導線頻寬固定,一旦資料量大增,傳輸速度就會減慢。而光通訊的頻寬較大, 滿足高速且大量的資料傳輸需求。然而光子傳輸與光/電整合技術仍有待克服的挑戰, 在測試方面比電子元件更複雜。

圖4 宜特科技故障分析工程處處長沈士雄博士

針對CPO產品的開發與測試,可靠度及材料分析的概念與一般的晶片相似,但是故障分析則因為光子元件的應用,變得比較困難。故障分析主要測試光路是否異常,包含光訊號在傳輸過程中的耗損等等。光路分析較為困難的原因在於,光訊號的傳遞無法隨時停止。可能光子輸入的時候能量是100%,輸出只剩下50%,但是很難分析傳輸過程中可能的問題。另外光/電、電/光轉換也可能出現多種異常狀況,仍需要持續尋找適合的設備,並擬定更精準的測試方法。

CPO可望擴大應用

CPO的應用將與AI發展相輔相成,長遠來看,也可能擴及其他應用領域。陳奕豪認為,現階段CPO以高效能運算(HPC)為主,AI資料中心與未來6G的應用也能借助CPO的優勢,實現資料傳輸高頻寬、低延遲及低功耗的目標。由於在CPO發展初期的導入成本較高,因此包含AI等高附加價值的應用會優先採用。未來當CPO的成本降低,穿戴式裝置考量到低功耗與小尺寸的設計需求,也可能採用CPO。

整體而言,CPO有助於解決AI訓練大型模型時,大量資料傳輸速度不足以滿足運算需求。光子傳輸突破銅線傳輸的頻寬限制、降低傳輸功耗,更透過CPO整合電子與光子,突破資料傳輸速度的上限。接下來的三到五年,待CPO克服結構與光路/電路設計等挑戰,進入量產並降低成本,可望看到CPO應用開枝散葉,擘畫資料傳輸的新時代。

訂閱電子報 友善列印 字體大小:
獲取產業訊息零時差!立即訂閱電電公會電子報。