11 月 10 日消息,英特爾今天正式推出了全球首款配備 HBM 內(nèi)存的 x86 CPU——Intel Xeon Max 系列,也就是之前我們稱之為 Sapphire Rapids(HBM)的旗艦級(jí)產(chǎn)品線。
新至強(qiáng)中的 56 個(gè)內(nèi)核均為 P 核,可提供 112 個(gè)線程和 350W TDP。它采用基于 EMIB 的設(shè)計(jì),分為四個(gè)集群。但最有趣的是,它還具有 64 GB 的 HBM2e 內(nèi)存,分為 4 個(gè) 16 GB 的集群,總內(nèi)存帶寬為 1 TB / s,每個(gè)內(nèi)核的 HBM 都超過 1 GB。
英特爾還表示,HBM 內(nèi)存的集成不需要更改代碼,并且應(yīng)該對(duì)用戶實(shí)現(xiàn)無縫透明。
“為了確保沒有 HPC 工作負(fù)載掉隊(duì),我們需要一個(gè)能夠?qū)挕⒂?jì)算、生產(chǎn)力最大化并最終可使得影響最大化的解決方案。英特爾 Max 系列產(chǎn)品系列為更廣闊的市場(chǎng)帶來了高帶寬內(nèi)存,以及一個(gè) API,使 CPU 和 GPU 之間的代碼共享更容易,并更有效地解決世界上最大的挑戰(zhàn)。
—— 英特爾公司副總裁兼超級(jí)計(jì)算集團(tuán)總經(jīng)理 jeff McVeigh
據(jù)介紹,這 56 個(gè)內(nèi)核由四個(gè) Die 構(gòu)成,并使用英特爾的多芯片互連橋 (EMIB) 進(jìn)行連接,其中封裝了64GB HBM 內(nèi)存,該平臺(tái)將采用 PCIe 5.0 和 CXL 1.1 I / O 接口。
在 HCPG 性能相同的情況下,功耗比 AMD Milan-X 集群低 68%。
AMX 擴(kuò)展可提高 AI 性能,并為 INT8 和 INT32 累積操作提供比 AVX-512 高 8 倍的峰值吞吐量。
提供在不同 HBM 和 DDR 內(nèi)存配置中運(yùn)行的靈活性。
工作負(fù)載基準(zhǔn):
氣候建模:僅使用 HBM 在 MPAS-A 上比 AMD Milan-X 快 2.4 倍。
分子動(dòng)力學(xué):在 DeePMD 上,與具有 DDR5 內(nèi)存的競(jìng)爭(zhēng)產(chǎn)品相比,性能提高了 2.8 倍。
在性能方面。它與舊的英特爾至強(qiáng) 8380 系列處理器或 AMD EPYC 7773X 相比,可在某些工作負(fù)載中提供 5 倍的性能。
值得注意的是,AMD 明天將發(fā)布基于 Genoa 的數(shù)據(jù)中心 CPU,兩大系列 CPU 均已向 OEM 交付,因此這些數(shù)值對(duì)比其實(shí)沒什么用。
新 CPU 中還包含 20 個(gè)加速引擎,主要是用于 AVX-512、AMX、DSA 和英特爾 DL Boost 工作負(fù)載。據(jù)稱,英特爾在 MLPerf DeepCAM 訓(xùn)練中的性能比 AMD 7763 提升了 3.6 倍,比 NVIDIA 的 A100 提升了 1.2 倍。
據(jù)介紹,英特爾至強(qiáng) Max CPU 將在 Aurora 超級(jí)計(jì)算機(jī)中首次亮相,目前正在阿貢國家實(shí)驗(yàn)室建造。IT之家了解到,Aurora 有望成為第一臺(tái)超過 2 exaflops 峰值雙精度計(jì)算性能的超級(jí)計(jì)算機(jī)。
此外,Aurora 還將率先展示在單個(gè)系統(tǒng)中將 Max 系列 GPU 和 CPU 配對(duì)的強(qiáng)大功能,擁有超過 10000 個(gè)“刀片”,每個(gè)“刀片”包含六個(gè) Max 系列 GPU 和兩個(gè)至強(qiáng) Max CPU。