訂閱電子報∣ 友善列印字體大小 文章分享-Facebook 文章分享-Plurk 文章分享-Twitter
強化資料中心AI能力 NVIDIA力推認證伺服器
新電子廖專崇
獲取產業訊息零時差!立即訂閱電電公會電子報。

人工智慧(AI),需要透過新一代電腦的調校和測試,以推動其前進發展。藉由旗下GPU設計協助加速各類雲端伺服應用,並收購Mellanox使伺服器連網架構升級,NVIDIA提出以Ampere架構打造,資料中心可以透過合作夥伴取得最新的加速伺服器支援,以運行各項AI與資料分析作業,首波取得認證廠商包含Dell、技嘉、HPE,以及浪潮(inspur)與Supermicro。

首批採用NVIDIA A100 Tensor核心GPU的系統包含:

  • Dell EMC PowerEdge R7525與R740機架式伺服器
  • GIGABYTE R281-G30、R282-Z96、G242-Z11、G482-Z54、G492-Z51系統
  • HPE Apollo 6500 Gen10系統及HPE ProLiant DL380 Gen10伺服器
  • Inspur NF5488A5
  • Supermicro A+系統AS-4124GS-TNR及AS-2124GQ-NART

據產業研究機構Gartner估計,現有37%的組織在生產過程中使用AI技術,預估至2024年,這個比例將翻倍達到75%。每間公司都想在不斷成長的海量資料裡,找出具策略價值的洞察。例如,Walmart超市每個小時需要處理超過2.5PB的資料量。

用於篩選海量資料的AI模型數量在短短五年內成長了近三萬倍,也因此推動了對加速運算的需求。而使用的模型多樣性和作業負載也不斷增加,因此,企業需要具靈活性的GPU。資料量與用於篩選資料的AI模型皆不斷成長,使得資料中心和網路邊緣流量呈指數成長。為此,企業需要一個安全、可靠、高速,並且可以有效擴大規模的基礎設施。

NVIDIA認證系統可提供企業AI所需的效能、可程式化特性及安全處理能力。這些系統結合了採用NVIDIA Ampere架構的GPU運算能力,以及安全的NVIDIA Mellanox高速網路解決方案。為取得認證,系統需針對各種作業負載進行測試,包含從需要使用多個運算節點的作業,到只需單一GPU的部分運算能力即可完成的任務。經過最佳化的系統能夠運行NGC目錄中的AI應用程式,NGC目錄為NVIDIA針對GPU最佳化的應用程式中樞。

NVIDIA認證系統必須通過以下測試:

  • 深度學習訓練與推論
  • 機器學習演算法
  • 智慧影像分析
  • 網路與儲存裝置卸載

全球最大的雲端服務供應商以及全球排名前十大的超級電腦中,有八台皆採用NVIDIA的技術。而採用NVIDIA技術的系統,在MLPerf等AI基準測試中皆拔得頭籌。NVIDIA認證系統包含資料中心伺服器,其搭載多達八個A100 GPU和高速InfiniBand或乙太網路介面卡。OEM廠商使用NVIDIA Mellanox電纜、交換機以及如 ConnectX-6 InfiniBand 或乙太網路介面卡和 BlueField-2 DPU 等網路卡,對系統進行認證。這些網路卡除了擁有低延遲、高處理量的特色,還支援從啟動時的硬體信任根到應用程式的連接追蹤等多層安全保障。每套系統皆使用 NVIDIA Mellanox 8700 HDR 200G InfiniBand 交換機或 Mellanox SN3700 乙太網路交換機進行認證。

訂閱電子報 友善列印 字體大小:
獲取產業訊息零時差!立即訂閱電電公會電子報。