摩尔线程宣布推出Torch-MUSA v2.0.0版本,这是其面向PyTorch深度学习框架的MUSA扩展库的重要升级。新版本基于MUSA Compute Capability 3.1计算架构,支持原生FP8数据类型和PyTorch 2.5.0,提升了AI模型和大规模数据处理能力。
作为国产GPU的重大突破,Torch-MUSA v2.0.0率先实现对FP8数据类型的完整支持。FP8作为前沿低精度格式,可大幅提升大语言模型训练效率并降低显存占用。该版本还新增虚拟内存管理、MUSA Graph等技术,有效优化深度学习任务执行效率。
目前Torch-MUSA已完全开源,开发者可通过GitHub获取源代码。