发布时间:2025-09-14 来源:超类绝伦网作者:科比大杀四方
英伟达美国当地时间9日,发布了面向大规模上下文推理处理和视频生成AI应用的Rubin CPX GPU。该GPU基于“Rubin”架构构建但与此前已公布的RubinTensorCoreGPU又有不少区别之处。
Rubin CPX GPU采用经济高效的单片式设计,注重NVFP4数据格式计算资源,同时搭载了NVENC/NVDNC视频编解码单元,配备128GB的GDDR7显存。
根据英伟达官方提供的Rubin CPX GPU渲染图,该GPU包含4×4×3×4=192组的重复单元(参见下图黄色方框),应该对应着192组SM,这一数量与GB202相当。
而在机架系统层面,从 Vera Rubin NVL144到Vera Rubin NVL144 CPX,系统增加了144块Rubin CPX GPU,NVFP4算力提升了4.4EFLOPS、显存带宽提升了0.3PB/s、快速存储增长了25TB。
从显存带宽角度,每颗Rubin CPX GPU大致对应约2083GB/s显存带宽。考虑到512-bit显存位宽的GeForce RTX 5090拥有1792GB/s的显存带宽、Rubin CPX GPU的显存容量为128GB,Rubin CPX GPU应同样具备512-bit的显存位宽,显存等效速率估算数值约为32.55Gbps。