輝達(NVIDIA)宣布其最新NVIDIA T4 GPU廣受合作夥伴歡迎,成為有史以來採納速度最快的伺服器GPU。自9月份推出以來,全球各大電腦設備製造商已將T4 GPU導入超過57款不同的伺服器設計當中,並已可在雲端上使用。Google雲端平台是首位在雲端上為客戶提供T4 GPU效能的合作夥伴。

NVIDIA 加速運算副總裁暨總經理Ian Buck 表示,T4 GPU推出的時間僅僅只有60天,但現已可在雲端上使用,更獲得全球眾多伺服器製造商的支援。NVIDIA T4 GPU能夠大規模地為公有與私有雲提供密集運算工作負載所需的效能和效率。

T4 GPU 能夠加速多元的雲端工作負載,包括高效能運算、深度學習訓練與推論、機器學習、資料分析和繪圖。建構於全新NVIDIA Turing架構的T4 GPU擁有多重精度Turing Tensor核心和新RT核心,當與加速容器化軟體堆疊結合可大規模地提供前所未有的效能。

Google雲端產品管理資深總監Damion Heredia表示,終端用戶需要低延遲的即時視覺化與線上推論負載,Google雲端搭載的NVIDIA T4 GPU為我們的機器學習和視覺化客戶提供高擴充性、具成本效益、低延遲的平台,讓客戶能在降低費用之餘採用新的創新方法和加速應用。

NVIDIA表示,包括社交媒體和線上購物網站等消費性網際網路業者,是T4 GPU的早期採用者和最大的終端客戶群。DELL EMC、惠普企業、IBM、聯想與美超微等眾多伺服器企業皆已採用T4 GPU。T4 GPU是專為獨特的橫向擴展公有與企業雲環境所設計,將吞吐量、採用率和用戶並行性最大化,協助客戶有效率地處理用戶和資料的爆發性成長。

採用短版設計且只需70瓦的T4 GPU實際大小如同一條巧克力棒般小巧,因此擁有可搭載於正規伺服器或任何開放運算計畫超大規模伺服器設計的彈性。伺服器設計同樣擁有高度彈性與擴充性,可彈性選擇安裝一張T4 GPU或最高在單一節點放入20張GPU。

T4 GPU多重精度能力可為廣泛的人工智慧工作負載提供突破性地人工智慧效能並支援單精度效能FP32 8.1 TFLOPS、單精度效能 FP16 65 TFLOPS、INT8 精度130 TOPS和INT4精度 260 TOPS等四種層級的精度。此外,一台搭載兩張T4 GPU的伺服器即可處理需要安裝54顆處理器伺服器的人工智慧推論工作負載,而一台搭載兩張T4 GPU的伺服器即可替換一台搭載9個雙處理器插槽的伺服器進行人工智慧訓練。