英伟达Vera Rubin超级芯片首次曝光

xinwen.mobi · 发表于 6 天前

英伟达Vera Rubin超级芯片首次曝光，AI算力提升3倍
黄仁勋手持那颗闪耀着金属光泽的芯片，背后屏幕上“Vera Rubin”的字样格外醒目——这不仅是又一款新芯片的发布，更是英伟达向5万亿美元市值冲刺的底气。

在华盛顿特区举办的GTC DC 2025大会上，英伟达CEO黄仁勋首次向世界展示了下一代AI芯片——Vera Rubin超级芯片。这款以天文学家名字命名的芯片，不仅承载着英伟达对科学探索的致敬，更是其应对行业竞争、定义下一代计算模式的关键举措。

此次发布具有里程碑意义，它推动英伟达股价上涨2.99%，报收207.04美元/股，使英伟达成为全球首个市值破5万亿美元的科技公司。

01 架构突破：Vera Rubin的技术革命
英伟达Vera Rubin超级芯片采用一体化设计，在一块主板上整合了一颗Vera CPU和两颗Rubin GPU。

这种设计延续了英伟达Grace Blackwell的架构思路，但在性能和规格上实现了跨越式提升。

Vera CPU搭载了88个定制Arm架构核心，支持高达176线程，相比前代产品，其微架构可能进行了进一步优化，尽管英伟达尚未完全公布Vera CPU的具体架构细节。

每个Rubin GPU配备8个HBM4堆栈，容量达288GB。

HBM4是新一代高带宽内存，其带宽将从当前Blackwell的8TB/s提升至13TB/s，这意味着数据传输速度大幅提升，能够更好地满足AI大模型训练的海量数据需求。

互联技术一直是英伟达保持竞争优势的关键。

Vera Rubin超级芯片采用NVLINK-C2C互联技术，带宽达到了惊人的1.8TB/s，用于Vera CPU与Rubin GPU之间的高速连接。

02 性能飞跃：从Blackwell到Rubin
性能表现是Vera Rubin最引人注目的亮点。

单颗Rubin GPU的FP4精度计算能力约为50 PetaFLOPS，这意味着由两颗GPU组成的超级芯片FP4精度计算能力可达约100 PetaFLOPS。

在系统级性能方面，Vera Rubin NVL144平台可实现3.6 Exaflops的FP4推理算力与1.2 Exaflops的FP8训练算力，相比GB300 NVL72提升约3.3倍。

这一提升不仅源于芯片本身的设计，还得益于全系统优化。

Vera Rubin NVL144的系统总显存带宽为13TB/s，快速存储容量为75TB，分别较上一代提升60%。

同时，其具备双倍的NVLINK与CX9通信能力，最高速率分别达260TB/s与28.8TB/s。

03 产品路线图：从Rubin到Rubin Ultra
英伟达已经制定了清晰的产品路线图。

Rubin GPU目前已回到实验室进行测试，是由台积电代工的首批样品，预计将在2026年第三或第四季度进入量产阶段。

更为引人注目的是，英伟达计划在2027年下半年推出更高阶的Rubin Ultra NVL576平台。

这一平台将NVL规模从144扩展至576，CPU架构维持不变，GPU则升级为四颗Reticle尺寸核心。

Rubin Ultra NVL576平台的FP4推理算力高达15 Exaflops，FP8训练算力为5 Exaflops，相较GB300 NVL72提升高达14倍。

其HBM4显存带宽达到4.6PB/s，快速存储容量为365TB，分别是上一代的8倍。

这一系统将整个机架重新布局，单个机架规模解决方案内配有576个GPU，堪称真正的超算级别配置。

04 战略布局：不止于AI
黄仁勋特别强调，Rubin平台“并非单纯为AI设计，而是兼顧科研与AI的双重任务”。

它未为低精度AI性能牺牲传统高效能运算能力，依旧支持高精度FP64科学计算，确保物理模拟、气候模型、量子化学等科研任务能获得充分性能。

这一定位精准回应了AI平台常忽略科研需求的行业痛点。

英伟达的战略布局已经超越了传统的AI训练与推理市场，向更广阔的科研和国家战略领域扩展。

首批Vera Rubin系统将由惠普协助构建，部署于美国洛斯阿拉莫斯国家实验室（LANL）。

这些系统分别命名为“Mission”和“Vision”，前者专注国安任务，计划在2027年上线；后者服务开放科研与AI模型开发。

05 量子计算与AI工厂：生态系统的扩展
除了Vera Rubin芯片本身，英伟达还推出了NVIDIA NVQLink，这是一种开放式系统架构，可将GPU计算的极致性能与量子处理器紧密结合。

NVQLink实现了来自QPU的实时CUDA-Q调用，延迟低至约4微秒，以构建加速的量子超级计算机。

目前，已为17家QPU制造商、5家控制器制造商和9个美国国家实验室实现了量子和GPU计算的互联。

这一技术被黄仁勋称为“连结量子与经典超算的罗塞塔石碑”，解决了量子运算扩展中的整合难题。

同时，英伟达还推出了 Omniverse DSX，这是一个用于设计和运营100兆瓦到数千兆瓦（吉瓦级）AI工厂的综合蓝图。

一旦AI工厂完成虚拟设计，英伟达的合作伙伴就会提供工厂制造、测试并即插即用的预制模块，这将大大缩短构建时间并实现模块化可扩展性。

06 产业影响：重新定义竞争格局
Vera Rubin的发布正值竞争对手AMD刚刚拿下美国能源部10亿美元超算合约之际，在高性能计算市场掀起波澜。

为此，Vera Rubin被英伟达定义为“迄今最复杂计算平台”，从架构到性能均瞄准全面超越。

英伟达还与诺基亚合作打造支持6G的AI平台，推出AI原生无线6G技术栈NVIDIA Arc。

基于NVIDIA Aerial平台，并由加速计算驱动，未来诺基亚将集成这项技术。

此外，BlueField-4 DPU的推出进一步完善了英伟达的全栈式加速计算布局。

相较于之前的BlueField-3，BlueField-4可提供6倍计算能力且支持的AI工厂规模增加4倍。

Vera Rubin超级芯片的亮相不仅引发了行业震动，其“兼顾科研与AI”的定位、3.6 Exaflops推理算力的硬件指标，以及NVQLink对量子计算的布局，很可能将重新定义全球超算与计算竞争的全局。

当黄仁勋在GTC舞台上举起Vera Rubin芯片时，他手中握着的不仅是硅晶片与金属，更是未来几年全球AI发展的风向标。

从Blackwell到Rubin，英伟达的芯片迭代速度已让竞争对手难以企及，而Vera Rubin的问世，将进一步巩固其在AI计算领域的绝对领导地位。

		自动登录	找回密码
密码			立即注册

英伟达Vera Rubin超级芯片首次曝光

英伟达Vera Rubin超级芯片首次曝光

相关帖子