在美國加州舉辦的GTC(GPU Technology Conference)年度繪圖處理器技術大會,NVIDIA 率先響頭炮,NVIDIA將會推出新款人工智能晶片 Blackwell B200。
▲NVIDIA GPU Blackwell
NVIDIA 執行長黃仁勳在台上宣布,NVIDIA 會推出新款人工智能晶片 Blackwell,主要分作兩個型號,B200及由兩塊 B200 與一塊 Grace CPU 組合而成的 GB200。B200 GPU 共有 2080 億粒電晶體,並使用了客製化 4NP TSMC,一塊晶片就可提供高達 20 petaFLOPS 的 FP4 運算力。由兩塊 B200 晶片組成的 GB200 在1750 億組參數 GPT-3 模型的基準測試之中,測試到性能達 H100 的 7 倍,而訓練速度亦提高了 4 倍。
在這代 Blackwell 系列中,NVIDIA 用了第五代 NVLink,可以把 576 塊 GPU 互相通訊,可達每秒 1.8 TB 的雙向吞吐量。NVIDIA 為 GB200 提供了 「GB200 NVL72」大型超級運算產品,可將 36 塊 CPU 和 72 塊 GPU 集合在一組巨大的液冷機架中,具有 720 petaFLOPS 的 AI 訓練性能,或 1,440 petaFLOPS(1.4 exaFLOPS)的推理性能。預料 AWS、Google、微軟和 Oracle 將會是 GB200 NVL72 的首批客戶。
資料及圖片來源:IEEESpectrum