OpenAI近日宣布将“Realtime API”正式投入生产环境,面向企业与开发者推出新一代语音交互解决方案。该API核心组件“gpt-realtime”采用端到端Speech-to-Speech架构,响应更快、语音更自然,支持复杂指令处理,并新增语言切换、语气调整及多种语音选项。
在性能方面,gpt-realtime在多项基准测试中显著提升,工具集成流程也更加高效。API新增图像输入支持,开发者可控制模型访问图像范围,并可设置token上限以优化成本。此外,其使用成本下降20%,并提供安全内容检测与数据本地化存储功能,满足欧盟隐私合规要求。