科技媒体NeoWin报道,OpenAI近日推出gpt-oss-safeguard-120b和gpt-oss-safeguard-20b两款开源模型,这是继今年发布gpt-oss系列后的又一重要开源举措。新模型采用Apache 2.0许可证,允许开发者免费使用和修改。
与传统安全系统不同,该模型将安全边界的定义权交还开发者。其核心机制是在推理阶段直接解读开发者提供的安全策略,无需在训练阶段硬编码规则。模型支持完整的"思维链"输出,可清晰展示推理过程。
这种设计使开发者能随时调整策略,确保分类结果符合特定场景需求。OpenAI表示,该方法对处理新兴风险、复杂领域等四种场景尤为有效。目前模型已在Hugging Face平台开放下载。
免责声明:本文内容由开放的智能模型自动生成,仅供参考。

扫一扫关注微信