飞腾信息技术有限公司宣布,旗下腾云S5000C和腾锐D3000成功实现对DeepSeek全系列大模型的端到端支持,涵盖数据中心和终端场景。本地部署的推理效率与国外同类产品相当,标志着国产AI技术的重大突破。
DeepSeek-V2.5 236B大模型在腾云S5000C平台稳定运行,基于该设备搭配8块国产AI卡,整体性能达到国外平台的80%左右。DeepSeek-V3和R1版本发布后,飞腾技术团队在腾云S5000C和腾锐D3000上进行了本地部署验证,形成完整的解决方案。
在数据中心侧,腾云S5000C服务器可与多款AI加速卡配合,实现DeepSeek蒸馏版和全量版部署。单机8卡服务器平台测试显示,蒸馏版DeepSeek-R1-Distill-Llama-70B的推理速度可达22tokens/s。完整版DeepSeek R1 671B模型则通过分布式推理框架,在四机32卡AI服务器集群上成功部署。
用户终端侧,基于腾锐D3000的台式机能够本地部署DeepSeek-R1 7B蒸馏版模型,搭配1张国产推理卡,实现强大的AI PC功能。
免责声明:本文内容由开放的智能模型自动生成,仅供参考。