国家超算互联网平台近日宣布上线阿里巴巴开源推理模型QwQ-32B的API接口服务,用户可免费获得100万Tokens的使用额度。QwQ-32B是阿里Qwen团队基于Qwen2.5-32B与强化学习技术构建的最新模型,在AIME24数学能力评测和LiveCodeBench代码能力评估中表现优异,与DeepSeek-R1相当,优于o1-mini及同尺寸R1蒸馏模型。
平台已完成QwQ-32B的全面适配,支持基于vLLM和PyTorch的推理,并提供模型镜像和文件,用户无需本地下载即可通过Notebook功能一键启动,实现模型开发或私有化部署。此外,超算互联网还上线了DeepSeek-R1全家桶及最高671B满血版API部署与AI Web应用服务。
目前,平台已连接国内14个省的20多家超算和智算中心,提供超6500款算力商品,其中包括近240款AI模型服务,涵盖DeepSeek、Qwen等国内模型以及Llama、Stable Diffusion、Gemma等国际开源模型。