最新最快科技资讯
太阳能光伏网

FFmpeg 8.0将整合OpenAI Whisper模型,实现音频自动转字幕

多媒体框架FFmpeg开发团队近日宣布,即将发布的8.0版本将新增名为Whisper的音频过滤器,该功能基于OpenAI的Whisper语音识别模型,可自动识别视频背景音频内容并转换为文字描述,输出为字幕或结构化数据。

用户需提前安装whisper.cpp库,并在编译时启用相应选项。Whisper过滤器支持TXT、SRT、JSON等多种输出格式,并可通过HTTP协议传输结果。默认情况下,转录内容将作为元数据附加至音频帧,便于后续处理。

此外,该功能支持队列参数调整,用户可根据需求平衡识别延迟与准确率,同时兼容GPU加速和多线程处理,显著提升转录效率。结合Silero语音活动检测技术,还能在长音频流中精准切分语音片段,优化识别效果。

最新相关

山西大同市云州区发生3.8级地震

8月16日16时46分,山西大同市云州区发生3.8级地震,震源深度11千米。此次地震位于北纬39.94度、东经113.48度,暂未报告人员伤亡或财产损失情况。免责声明: 本文内容由开放的智能模型自动生成,仅...

湖北发布高温橙色预警 局地气温将超39℃

8月16日15时54分,湖北省气象台发布高温橙色省级预警。预计17日白天,除西部高海拔地区外,全省大部分地区最高气温将达35~38℃,其中恩施北部、宜昌、武汉、鄂州、黄冈、黄石、咸宁等地局地气温...

海南三沙市举行2025年开渔活动

8月16日,为期三个半月的南海伏季休渔期结束。在西沙永兴岛西渔码头,海南三沙市举行2025年开渔活动,渔民陆续出海捕鱼,标志着新一轮捕捞季正式开启。免责声明: 本文内容由开放的智能模型自动生...

山东荣成面包车坠海致6人遇难

8月16日4时许,山东荣成市桃园渔港发生一起面包车坠海事故,车上11人中6人不幸遇难,3人获救生命体征平稳,其余2人正在搜救。事故原因及善后工作正在进行中。免责声明: 本文内容由开放的智能模型...

星动L7夺首届机器人跳高冠军

2025年8月16日,在首届世界人形机器人运动会第二天比赛中,星动纪元的全尺寸双足人形机器人星动L7在原地跳高项目中以0.95米的成绩夺冠。江淮中心凌空行者队以0.87米获得亚军,魔法原子以0.52米位...