OpenAI 考虑开源新大模型,CEO 萨姆・奥尔特曼征询公众意见

18 02月 2025

2025-02-18 12:16

OpenAI首席执行官萨姆・奥尔特曼于当地时间2月17日在X社交平台上发文，就公司下一个开源项目的方向征询公众意见。他提出了两种可能的开源模型方向：一种是“相当小但仍需在GPU上运行的o3-mini级模型”，另一种则是“尽可能优化的手机大小模型”。这或许意味着OpenAI即将开源新的大模型，也将是2019年OpenAI开源GPT-2之后再次开源某个大模型。

奥尔特曼在1月31日Reddit的“问我任何事”活动中，被问及OpenAI是否会公开部分AI模型技术并发布更多系统工作原理的研究时，他表示公司内部正在讨论这种可能性，并反思了OpenAI在开源方面的过往立场。他承认，OpenAI此前在开源策略上可能“站在了历史的错误一边”，并称需要制定不同的开源策略。不过他也指出，公司内部并非所有人都认同这一观点。

2015年成立后，OpenAI曾表示会在符合公众利益的情况下公布其模型的研究和数据。但后来出于竞争压力和对信息披露可能带来的安全风险的担忧，公司转向了专有模型的开发。

然而，近期AI科技行业的新变化似乎促使OpenAI重新审视其开源策略。DeepSeek的横空出世，以其低成本和开源模式迅速吸引了众多用户，其大模型DeepSeek-R1仅用两个月完成训练，成本仅为550万美元，相比之下，OpenAI等公司的同类项目成本要高出许多。自ChatGPT于2022年年底推出后，许多AI公司为保持竞争力，选择不公开过多技术细节。但如今，随着DeepSeek等开源技术的兴起，部分开发者和客户可能会转向更具性价比的开源解决方案。