最新最快科技资讯
太阳能光伏网

DeepSeek发布最新开源数学推理模型Prover-V2-671B

【太平洋科技快讯】4月30日消息,DeepSeek在AI开源社区Hugging Face发布了其最新数学推理模型——DeepSeek-Prover-V2-671B。该模型参数量高达6710亿,从命名推测,这可能是对去年发布的Prover-V1.5模型的重大升级。

DeepSeek-Prover-V2-671B基于混合专家(MoE)架构,并采用Lean 4框架进行形式化推理训练。该模型结合了强化学习和大规模合成数据,显著提升了自动化证明能力。此外,新模型支持BF16、FP8和F32等多种计算精度,并采用高效的safetensors文件格式,使得训练和部署更加快速且节省资源。

该模型的发布也可能为DeepSeek的R2系统铺路,进一步验证其在复杂推理任务中的能力。同时,它也为AI在数学领域的应用提供了新的可能性,例如加速数学知识的发现和验证。

最新相关