NVIDIA 推出首款用于 AI 代理的内部 CPU Vera,承诺性能比 x86 处理器提升 1.8 倍,面向超大规模企业和 AI 实验室。
NVIDIA 于 2026 年 6 月 1 日在台北 GTC 上宣布,正式推出了 Vera CPU,这是一款专为人工智能代理和强化学习打造的处理器。Vera 旨在提供比传统 x86 处理器快 1.8 倍的性能,面向超大规模云提供商、人工智能实验室以及寻求优化代理人工智能和数据处理工作负载的企业。
“人工智能代理将成为最大的计算用户,”NVIDIA 首席执行官黄仁勋在声明中表示。 “Vera 是首款专为未来而设计的 CPU,旨在超大规模运行代理 AI,具有非凡的性能、效率和可编程性。”
Vera 是 NVIDIA 第一个完全内部的 CPU 架构,标志着与其早期依赖 Arm 设计内核的 Grace 系列的战略背离。 Vera 拥有 88 个 Olympus 核心,拥有空间多线程和 LPDDR5X 内存等功能,可提供高达 1.2TB/s 的带宽,使其能够大规模处理 Python 运行时、数据库查询和强化学习等密集型工作负载。根据 Phoronix 的基准测试,Vera 在特定于代理的任务(例如代码编译和数据编排)方面优于竞争对手架构。
行业领导者采用
Anthropic、OpenAI 和 SpaceXAI 等全球人工智能实验室正在评估 Vera,以扩展其代理工作负载,而字节跳动、Oracle Cloud Infrastructure (OCI) 和 CoreWeave 等超大规模企业则计划在其人工智能工厂中部署 Vera CPU。戴尔、联想和 Supermicro 等 OEM 厂商将把该处理器集成到独立服务器系统中,预计于 2026 年秋季上市。OCI 的 Mahesh Thiagarajan 强调了该芯片的潜力,他表示:“通过部署 NVIDIA Vera CPU,OCI 将支持下一代 AI 环境中的高吞吐量推理和数据处理工作负载。”同样,纽约证券交易所集团总裁 Lynn Martin 也提到了 Vera 在优化交易所基础设施方面所发挥的作用,该基础设施每天处理超过 1.1 万亿条消息。
向垂直整合人工智能的战略转变
Vera 的推出凸显了 NVIDIA 更广泛地转向垂直集成人工智能解决方案。该芯片充当 Vera Rubin 平台内的主机处理器,通过 NVLink-C2C 互连技术与 Rubin GPU 紧密耦合。这种配置可加速 GPU 密集型工作负载的数据移动和协调,使 Vera 成为 NVIDIA 人工智能基础设施战略的基石。
Vera 的效率提升和任务专业化反映了人工智能工厂经济的转变。 NVIDIA 正在将行业从传统的每核心成本指标转向每美元代币框架,在该框架中,更快的任务完成速度会直接影响盈利能力。该公司估计 Vera 的效率将产生更高的端到端吞吐量,特别是在响应时间至关重要的密集、大规模数据中心。
市场背景
此次发布正值 NVIDIA 巩固其在 AI 硬件领域的主导地位之际。该公司最近公布了 816 亿美元的季度收入,并宣布计划投资 2000 亿美元扩大其人工智能生态系统。截至 2026 年 5 月 30 日,NVIDIA 股价为 211.14 美元,该公司市值为 5.15 万亿美元。分析师认为 Vera 是云和企业采用的关键驱动力,进一步巩固了 NVIDIA 对人工智能市场的控制。
尽管维拉具有潜力,但仍面临审查。早期基准测试表明,其性能优势主要存在于 NVIDIA 优化的工作流程中,这引发了对其在非专业环境中的多功能性的质疑。然而,随着 AWS 和 Google Cloud 等主要云提供商预计将在今年晚些时候部署基于 Vera Rubin 的实例,采用势头似乎很强劲。
展望未来
Vera 系统将于 2026 年秋季开始向系统构建商和云合作伙伴提供。NVIDIA 扩大生产规模和兑现性能承诺的能力对于超大规模企业和从 x86 架构过渡的企业的采用至关重要。对于交易者来说,Vera 的市场影响可能取决于 NVIDIA 将早期兴趣转化为长期收入增长的程度。
