英伟达近日推出专为大规模上下文处理设计的GPU——Rubin CPX,旨在提升AI任务效率,涵盖视频生成与大规模编码等高要求场景。该产品将理解提示与生成响应任务分离,优化整体处理流程。Rubin CPX配备128GB GDDR7显存,支持3倍注意力机制能力,并提供30 petaflops计算性能。其将作为Vera Rubin平台的一部分,集成Vera CPU与Rubin GPU,全机架版本AI性能达8 exaflops。英伟达CEO黄仁勋称其为首款专为大规模上下文AI设计的CUDA GPU,预计2026年底推出,并强调其可带来显著投资回报。
免责声明:本文内容由开放的智能模型自动生成,仅供参考。