OpenAI首席执行官萨姆・奥尔特曼于当地时间2月17日在X社交平台上发文,就公司下一个开源项目的方向征询公众意见。他提出了两种可能的开源模型方向:一种是“相当小但仍需在GPU上运行的o3-mini级模型”,另一种则是“尽可能优化的手机大小模型”。这或许意味着OpenAI即将开源新的大模型,也将是2019年OpenAI开源GPT-2之后再次开源某个大模型。
奥尔特曼在1月31日Reddit的“问我任何事”活动中,被问及OpenAI是否会公开部分AI模型技术并发布更多系统工作原理的研究时,他表示公司内部正在讨论这种可能性,并反思了OpenAI在开源方面的过往立场。他承认,OpenAI此前在开源策略上可能“站在了历史的错误一边”,并称需要制定不同的开源策略。不过他也指出,公司内部并非所有人都认同这一观点。
2015年成立后,OpenAI曾表示会在符合公众利益的情况下公布其模型的研究和数据。但后来出于竞争压力和对信息披露可能带来的安全风险的担忧,公司转向了专有模型的开发。
然而,近期AI科技行业的新变化似乎促使OpenAI重新审视其开源策略。DeepSeek的横空出世,以其低成本和开源模式迅速吸引了众多用户,其大模型DeepSeek-R1仅用两个月完成训练,成本仅为550万美元,相比之下,OpenAI等公司的同类项目成本要高出许多。自ChatGPT于2022年年底推出后,许多AI公司为保持竞争力,选择不公开过多技术细节。但如今,随着DeepSeek等开源技术的兴起,部分开发者和客户可能会转向更具性价比的开源解决方案。