Phoronix 对 NVIDIA 最新款 "Vera" CPU 进行了独家测试,首批基准测试展示了 NVIDIA 在定制 CPU 设计方面的突破。初步结果显示,这款基于 Arm 的 CPU 平台性能强劲,足以在数据中心领域超越最新的 Intel Xeon 和 AMD EPYC 处理器。"Vera" CPU 配备 88 个定制 Armv9.2 "Olympus" 核心,通过物理资源分区实现 176 线程。这些定制核心支持原生 FP8 处理,配合 6x128-bit SVE2 实现,使某些 AI 工作负载能直接在 CPU 上执行。该芯片拥有 1.2 TB/s 的内存带宽,并支持高达 1.5 TB 的 LPDDR5X 内存,采用 SOCAMM2 封装形式。第二代可扩展一致性互连 (Scalable Coherency Fabric) 提供 3.4 TB/s 的对分带宽,在统一单片裸片上连接所有核心,消除了小芯片架构中常见的延迟问题。
作为对比,Phoronix 测试了单路和双路 Intel Xeon "Granite Rapids" 6980P 处理器,以及 AMD EPYC "Turin" 与 "Turin Dense" 系列型号(如 AMD EPYC 9755、9575F 和 9475F)。他们还纳入了基于 Arm Neoverse V2 核心的 NVIDIA 第一代 "Grace" 设计。NVIDIA 只允许在这颗预发布芯片上运行特定子集测试,包括代码编译、流内存性能、视频编码、Python/Java 以及数据库性能等标准负载。在所有测试结果的几何平均值中,NVIDIA 的 "Vera" 位居榜首,性能比 AMD 最先进的设计高出近 11%,比性能最强的单路 Intel Xeon 高出约 55.3%。它甚至超越了双路配置,这表明某些工作负载在多路间存在扩展性问题。这些有限的结果表明,"Vera" 超越了任何基于 Arm 的设计,其 CPU 的 TDP 为 450 W,而 768 GB 内存池的功耗为 50 W。


阅读全文
原文链接:NVIDIA "Vera" CPU Benchmarked: Beating Intel Xeon and AMD EPYC in Select Workloads
中文由 deepseek-v4-flash 大语言模型翻译,不保证其准确性。