AMD近日推出ROCm 7.0计算软件堆栈,进一步扩展对锐龙AI处理器及Radeon显卡的支持。新版本在AI推理任务中表现突出,官方数据显示,Instinct MI355X在DeepSeek R1基准测试中的FP8吞吐量较NVIDIA Blackwell B200高出30%。
相比上一代,ROCm 7在多个大模型上实现显著性能跃升,其中DeepSeek R1性能提升达3.8倍。该版本还新增对MI350系列GPU的支持,并兼容Ubuntu 24.04等最新操作系统,同时集成PyTorch、TensorFlow等主流AI框架,助力提升大规模AI部署效率与稳定性。
免责声明:本文内容由开放的智能模型自动生成,仅供参考。