作者:Arm終端事業部產品管理高級總監 Stefan Rosinger
在之前有關 Arm Cortex-X925 CPU的解計算鍵文章中,Arm 技術專家曾探討了每時鐘周期指令數 (IPC) 作為評估 CPU 性能的讀A打造的關關鍵指標的重要性。與主要將頻率作為性能指標的為何做法不同,IPC 衡量的高性是 CPU 每個時鐘周期內能處理的指令數。對于移動設備而言,高能效電池續航和散熱管理是移動影響實際應用、用戶體驗和設備處理復雜工作負載的解計算鍵關鍵所在。因而,讀A打造的關IPC 對于評估移動設備性能而言,為何至關重要。高性
更高的高能效頻率 ≠ 最優表現
IPC 越高,表示在一個時鐘周期內執行的移動指令越多;即便時鐘速度較慢,也能帶來更好的解計算鍵性能。這對于內存受限的讀A打造的關工作負載尤為重要,因為其性能會受到 CPU 外部因素的為何制約。更高的 IPC 使得 CPU 能以更低的頻率運行,從而減少電量消耗和功耗,設備發熱也會緩解。這對于需要保持穩定性能的移動設備來說,尤為有利。
雖然高頻 CPU 乍聽起來很有吸引力,但它并不能反映性能的全貌。頻率表示 CPU 每秒完成的時鐘周期數量,而 IPC 則表示每個周期所完成的工作量。事實上,最高頻率很少會用到。例如,對于游戲和其他算力要求較高的工作負載來說,并不會以最大頻率使用 CPU,大多數時間反而是以中檔頻率運行。此時的能效更高,可以延長電池續航時間并降低設備溫度,而這兩者是提升整體用戶體驗的重要指標。
在相同的時間周期內,具有更高 IPC 的 CPU 在處理實際應用和復雜工作負載時會表現出更優的性能。即便是當今具有復雜計算需求的 AI應用(例如聊天機器人、實時語言翻譯和虛擬助手),在 IPC 更高的 CPU 上運行時也會表現得更加出色。此外,就能效而言,在一個周期內執行更多的指令意味著可以更快地完成任務,使得 CPU 處于高能耗狀態的時間減少,從而節省電池電量。
卓越的架構設計
在基于 Armv9 架構的 CPU 設計中,可伸縮向量擴展 (SVE2) 是提高 IPC 的關鍵所在。這一架構特性采用新的專用向量指令,是加速智能手機關鍵工作負載和應用的理想之選。
SVE2 可將 HDR 視頻解碼速度提高約 10%,這樣用戶在主流應用上觀看點播視頻時,能獲得更長的電池續航時間。此外,通過加速常用的圖像處理庫,SVE2 還增強了視頻通話期間用戶體驗的流暢度,同時提高了畫面質量。其中包括更好的攝像頭旋轉體驗,以及圖像濾鏡的切換和使用體驗。
不僅如此,SVE2 還不受向量長度的影響,這意味著代碼開發將支持更大的向量長度,例如 256 位。由此可確保與移動計算未來發展的兼容性,包括未來更注重邏輯擴展,而非 RAM的先進工藝節點。移動端市場將因此能夠適應更大的向量長度,有利于游戲和 AI 模型中 SVE 代碼的呈現。
通過深入研究設計,IPC 性能可借助一系列特定的微架構改進得以提高。其中包括但不限于:
超標量亂序執行
分支預測和預取器
數據推測
適當的緩存選擇
Arm Cortex CPU 一直在逐年推進各種類似的微架構改進,以實現更高的性能水平。
面向移動端的最新 Armv9 CPU
上述的架構特性和微架構提升是 Arm 面向移動端市場的最新 Armv9 CPU 的核心所在。作為 MediaTek 天璣 9400(已被搭載于 vivo X200 系列等旗艦智能手機)的核心,Cortex-X925 對私有 L2 緩存進行了升級,從 2MB 增加到 3MB。再加上 Cortex-X925 能夠更加快速、高效地預取數據和復雜指令,從而顯著增強了 CPU 的整體性能和能效。得益于此,Arm 計算平臺在 2024 年實現了驚人的兩位數 IPC 性能提升。
如此一來,終端用戶能夠享受到一系列實際性能的提升,包括更快的應用響應速度、更好的游戲體驗、更流暢的視頻流媒體傳輸、更快的網頁瀏覽和順暢的多任務處理。同時,更高的 IPC 也帶來了能效的提升,延長了用戶的沉浸式體驗。
與此同時,Cortex-A725 作為 CPU 工作負載的主力,也進行了一系列針對性更新,著力于需要持續出色性能的關鍵 AI 和游戲用例。與 Cortex-A720 相比,Cortex-A725 的性能效率提升了 35%,能效提升了 25%。
在 Armv9.2 集群中,每個 CPU 組件都能應對廣泛的實際用例和復雜的工作負載。例如,Cortex-X925 可處理應用啟動和網頁瀏覽的“突發”工作負載,而 Cortex-A725 則可以在常見的移動端用例(包括游戲、網頁瀏覽、基于攝像頭的應用和視頻流媒體)中持續提供穩定性能,以延長設備的使用時間(即電量耗盡之前,用戶可在設備上使用某些用例的平均時間)。
打造無可比擬的移動端體驗
從根本上說,移動設備需要兼具性能與能效,而 IPC 的提升恰好能同時滿足這個需求。用戶因而能更長時間體驗各種需要高算力的應用。最新的 Armv9 CPU 將卓越的 IPC 水平與高時鐘頻率相結合,將性能和能效提升到一個更高的水平,從而為最終用戶帶來更加出色的用戶體驗。這也正是為什么全球 99% 的智能手機都基于 Arm 計算平臺打造的原因之一。