英伟达Vera Rubin超级芯片首次曝光,AI算力提升3倍
黄仁勋手持那颗闪耀着金属光泽的芯片,背后屏幕上“Vera Rubin”的字样格外醒目——这不仅是又一款新芯片的发布,更是英伟达向5万亿美元市值冲刺的底气。
在华盛顿特区举办的GTC DC 2025大会上,英伟达CEO黄仁勋首次向世界展示了下一代AI芯片——Vera Rubin超级芯片。这款以天文学家名字命名的芯片,不仅承载着英伟达对科学探索的致敬,更是其应对行业竞争、定义下一代计算模式的关键举措。
此次发布具有里程碑意义,它推动英伟达股价上涨2.99%,报收207.04美元/股,使英伟达成为全球首个市值破5万亿美元的科技公司。
01 架构突破:Vera Rubin的技术革命
英伟达Vera Rubin超级芯片采用一体化设计,在一块主板上整合了一颗Vera CPU和两颗Rubin GPU。
这种设计延续了英伟达Grace Blackwell的架构思路,但在性能和规格上实现了跨越式提升。
Vera CPU搭载了88个定制Arm架构核心,支持高达176线程,相比前代产品,其微架构可能进行了进一步优化,尽管英伟达尚未完全公布Vera CPU的具体架构细节。
每个Rubin GPU配备8个HBM4堆栈,容量达288GB。
HBM4是新一代高带宽内存,其带宽将从当前Blackwell的8TB/s提升至13TB/s,这意味着数据传输速度大幅提升,能够更好地满足AI大模型训练的海量数据需求。
互联技术一直是英伟达保持竞争优势的关键。
Vera Rubin超级芯片采用NVLINK-C2C互联技术,带宽达到了惊人的1.8TB/s,用于Vera CPU与Rubin GPU之间的高速连接。
02 性能飞跃:从Blackwell到Rubin
性能表现是Vera Rubin最引人注目的亮点。
单颗Rubin GPU的FP4精度计算能力约为50 PetaFLOPS,这意味着由两颗GPU组成的超级芯片FP4精度计算能力可达约100 PetaFLOPS。
在系统级性能方面,Vera Rubin NVL144平台可实现3.6 Exaflops的FP4推理算力与1.2 Exaflops的FP8训练算力,相比GB300 NVL72提升约3.3倍。
这一提升不仅源于芯片本身的设计,还得益于全系统优化。
Vera Rubin NVL144的系统总显存带宽为13TB/s,快速存储容量为75TB,分别较上一代提升60%。
同时,其具备双倍的NVLINK与CX9通信能力,最高速率分别达260TB/s与28.8TB/s。
03 产品路线图:从Rubin到Rubin Ultra
英伟达已经制定了清晰的产品路线图。
Rubin GPU目前已回到实验室进行测试,是由台积电代工的首批样品,预计将在2026年第三或第四季度进入量产阶段。
更为引人注目的是,英伟达计划在2027年下半年推出更高阶的Rubin Ultra NVL576平台。
这一平台将NVL规模从144扩展至576,CPU架构维持不变,GPU则升级为四颗Reticle尺寸核心。
Rubin Ultra NVL576平台的FP4推理算力高达15 Exaflops,FP8训练算力为5 Exaflops,相较GB300 NVL72提升高达14倍。
其HBM4显存带宽达到4.6PB/s,快速存储容量为365TB,分别是上一代的8倍。
这一系统将整个机架重新布局,单个机架规模解决方案内配有576个GPU,堪称真正的超算级别配置。
04 战略布局:不止于AI
黄仁勋特别强调,Rubin平台“并非单纯为AI设计,而是兼顧科研与AI的双重任务”。
它未为低精度AI性能牺牲传统高效能运算能力,依旧支持高精度FP64科学计算,确保物理模拟、气候模型、量子化学等科研任务能获得充分性能。
这一定位精准回应了AI平台常忽略科研需求的行业痛点。
英伟达的战略布局已经超越了传统的AI训练与推理市场,向更广阔的科研和国家战略领域扩展。
首批Vera Rubin系统将由惠普协助构建,部署于美国洛斯阿拉莫斯国家实验室(LANL)。
这些系统分别命名为“Mission”和“Vision”,前者专注国安任务,计划在2027年上线;后者服务开放科研与AI模型开发。
05 量子计算与AI工厂:生态系统的扩展
除了Vera Rubin芯片本身,英伟达还推出了NVIDIA NVQLink,这是一种开放式系统架构,可将GPU计算的极致性能与量子处理器紧密结合。
NVQLink实现了来自QPU的实时CUDA-Q调用,延迟低至约4微秒,以构建加速的量子超级计算机。
目前,已为17家QPU制造商、5家控制器制造商和9个美国国家实验室实现了量子和GPU计算的互联。
这一技术被黄仁勋称为“连结量子与经典超算的罗塞塔石碑”,解决了量子运算扩展中的整合难题。
同时,英伟达还推出了 Omniverse DSX,这是一个用于设计和运营100兆瓦到数千兆瓦(吉瓦级)AI工厂的综合蓝图。
一旦AI工厂完成虚拟设计,英伟达的合作伙伴就会提供工厂制造、测试并即插即用的预制模块,这将大大缩短构建时间并实现模块化可扩展性。
06 产业影响:重新定义竞争格局
Vera Rubin的发布正值竞争对手AMD刚刚拿下美国能源部10亿美元超算合约之际,在高性能计算市场掀起波澜。
为此,Vera Rubin被英伟达定义为“迄今最复杂计算平台”,从架构到性能均瞄准全面超越。
英伟达还与诺基亚合作打造支持6G的AI平台,推出AI原生无线6G技术栈NVIDIA Arc。
基于NVIDIA Aerial平台,并由加速计算驱动,未来诺基亚将集成这项技术。
此外,BlueField-4 DPU的推出进一步完善了英伟达的全栈式加速计算布局。
相较于之前的BlueField-3,BlueField-4可提供6倍计算能力且支持的AI工厂规模增加4倍。
Vera Rubin超级芯片的亮相不仅引发了行业震动,其“兼顾科研与AI”的定位、3.6 Exaflops推理算力的硬件指标,以及NVQLink对量子计算的布局,很可能将重新定义全球超算与计算竞争的全局。
当黄仁勋在GTC舞台上举起Vera Rubin芯片时,他手中握着的不仅是硅晶片与金属,更是未来几年全球AI发展的风向标。
从Blackwell到Rubin,英伟达的芯片迭代速度已让竞争对手难以企及,而Vera Rubin的问世,将进一步巩固其在AI计算领域的绝对领导地位。
|
|