Arm 在 Hot Chips 2023(第 35 屆)除了介紹 Nvidia Grace CPU 的伺服 Neoverse V2 核心,也一併公布「不僅授權 Neoverse N2 的核心化核心 IP,更允許客戶購買更大現成 IP 模組,伺服以縮短設計時間,核心化並利於打造 Chiplet 化晶片」的伺服 Neoverse CSS(Compute Subsystem),Neoverse CSS N2(CSS Genesis)更是核心化第一個產品。
▲ Arm IP 越來越包山包海,伺服不限「指令集架構」和「微架構核心」,核心化更涉足「整個包好包滿」功能模組。伺服
Neoverse CSS N2 一口氣「打包」大量 IP,核心化且「軟硬兼備」,伺服所以由外到內,核心化內容量非常龐大,伺服也很值得一看,核心化瞧瞧 Arm 提前幫客戶「多做哪些事」,伺服至於是否「多收多少錢」,外人就不得而知了。
▲ Arm 說法是「鑑於摩爾定律放緩」加上先進製程越來越貴,設計晶片和開發軟體成本,隨製程微縮腳步水漲船高,就如我們熟悉的現況。
▲ 打包一堆 IP 的 CSS,將含完全驗證、生產就緒的 RTL(Register-Transfer Language)語言與配合製程和設計工具預先調校好的參考實作設計,並提供完整軟體參考堆疊,包括韌體、電源管理、系統管理、系統運行時安全性等一切內容,確保客戶不只快速做出可運作晶片,並客戶開發軟體時會有良好起點。此外,這也便於整合新穎技術,如 PCIe Gen5 和 CXL 記憶體擴展池。
▲ 有別於「授權指令集,自行從無到有研製整顆核心」(如蘋果)和「購買現成 IP,但仍需要耗費時間調校和驗證」(多數 IC 設計公司),Neoverse 打開更快客製晶片的途徑。
▲ Neoverse CSS 的核心精神:Arm 先替客戶準備好「無需太多調校和驗證,即可迅速生產就緒」的 IP 功能模組,當然羊毛出在羊身上,究竟花錢買時間劃不劃算,只有晶片廠商自己知道。以 Arm 舉例,產品開發時相較純 IP 授權,CSS 可節省「80 年工程時間」(代表 80 人做一年)或「從開案到可動晶片只要 13 個月」。
▲ Neoverse CSS N2(CSS Genesis)是第一個產品,從雲端資料中心到 5G 邊緣都有機會派上用場,Perseus N2 核心網路可從 24 個核心擴展到 64 個核心,並可使用 UCI Express 或專屬互連架構,將四個核心封裝在一起,以便擴展到單一插槽 256 核心。
▲ Neoverse CSS N2 可從每個晶片 24、32 和 64 核心拓展,並具連接 DDR5、LPDDR5、PCIe、CXL 和其他類型 IP 的介面。晶粒面積分別是 53 平方公釐(24 核心)、61 平方公釐(32 核心)、198 平方公釐(64 核心)。
▲「 開箱即用」的 CSS 直接沿用標準 Arm CMN-700 互連匯流排將不同元件連接在一起。CSS N2 須符合以下 System Ready 認證:
Arm Base System Architecture 1.0
Arm Server Base System Architecture 6.1
Arm Server Base Boot Requirements 1.2
▲ 也理所當然,CPU 核心 IP 基於 Neoverse N2。有兩個 SVE2 128 位元向量單元看起來還不錯,但 Neoverse V2 卻有四個。
▲ 系統控制和管理的 IP 區塊。
▲ 系統記憶體管理單元(MMU)和中斷控制器。
▲ 存在多年的 CMN-700 互連匯流排,包含系統層級快取(SLC)和基於網格(Mesh)拓樸的快取資料一致性互連,運作時脈 2GHz。
▲ 假如 Arm 客戶想連接額外加速器,當然也會有連接加速器的 IP。
▲ 透過將兩個 64 核心 Neoverse N2 Chiplet 連接,可達每個插槽 128 個核心,但這在 Arm 伺服器的世界並不新奇,況且 128 個 Neoverse N2 的性能也無法匹敵 AMD 的 128 個 Zen 4c 核心的 EPYC 97×4 Bergamo。
▲ 多晶片連接界面。
▲ 多處理器環境的 CMN Gateway,但似乎並非為了高階多插槽 CPU 系統設計的產物。
▲ 客戶可透過 CXL 擴充記憶體容量。
▲ 可支援 CXL Type-3 的記憶體擴展設備。
▲ 64 核 Arm Neoverse CSS N2 布局,兩個核心組成一個 Tile,預估晶粒面積 198 平方公釐,臺積電 5 奈米製程。
▲ 兩個 Neoverse N2 核心也是透過 CMN-700 連接,包括兩塊1MB的系統層級快取(SLC)區塊。
▲ Neoverse CSS 還有 RTL 和其他軟體設計工具平臺,以便加速開發。
▲ 總之,Arm 表示「統統幫你做成半成品」的 Neoverse CSS,分別替兩個客戶「從開案到可動晶片僅有 13 個月」和「節約 80 年工程開發時間」。
Neoverse CSS N2 問世,允許晶片設計公司更能在「非 Chiplet」的系統單晶片(SoC)輕鬆整合 Neoverse N2 核心。隨著時間推移,Arm 勢必將 Neoverse CSS 擴展到其他核心類型(如 Neoverse V 和 Neoverse E),看在 Chiplet 蔚為風潮的份上,哪天突然跑出可隨時與 UCIe(Universal Chiplet Interconnect Express)整合的 Neoverse 晶片,也不讓人意外。
(首圖來源:Arm)
延伸閱讀:
- 雲端是未來,那 ARM 在伺服器市場到底有沒有搞頭?
- 一樣是 ARM 架構,為何蘋果行動裝置處理器效能就是壓下其他人?
- 從 2017 年 Hot Chips 29 一窺晶片業界現況與趨勢
- 充滿傳奇色彩且對後世影響深遠的 Alpha 處理器
- 時代的眼淚系列:繁華落盡的 SPARC 處理器
- 促使 Nvidia 大手筆購併 Arm 的原因是什麼?
- Nvidia Smart NIC 不單是 Arm 與 GPU 送做堆,而是「掀起革命一角推翻 x86」的起點
- 現在是 AMD 進攻 ARM 伺服器的好時機嗎?
- 英特爾與 AMD 的 x86 伺服器戰爭編年史
- 如果英特爾自己重新打造 ARM 處理器會發生什麼事
- 回顧歷史夢幻處理器:RISC 諸神的最後榮光
- 一覽處理器廠商的「人工智慧推論加速單元」:智慧手機篇(上)
- 一覽處理器廠商的「人工智慧推論加速單元」:智慧手機篇(下)