最新最快科技资讯
太阳能光伏网

深度求索公司公布新型数据采集专利,助力大语言模型训练效率提升

国家知识产权局最新公告显示,杭州深度求索人工智能基础技术研究有限公司申请的“一种广度数据采集的方法及其系统”专利于4月1日正式公布。该技术旨在优化网页数据采集流程,通过智能筛选链接、分析内容质量及优化下载分配,显著减少低效或重复下载,从而提升数据质量并降低网络资源消耗。

专利摘要指出,该系统采用独立的信息回灌队列设计,确保数据处理的稳定性,同时避免对目标网站造成流量冲击。当前,大语言模型训练依赖高质量、多样化的数据集,但传统采集技术常面临链接遗漏、过量访问及内容质量不足等问题。深度求索的解决方案有望为人工智能领域提供更高效的数据支持,推动自然语言处理技术发展。

最新相关

岚图FREE+上市 售价21.99万元起

7月12日,岚图FREE+正式上市,售价21.99万元起。该车型全系标配华为乾崑智驾ADS4和鸿蒙智能座舱5,并搭载全球混动SUV首个全拟真换挡系统"岚擎模式"。新车聚焦智能驾驶与智能座舱体验升级,进一步...

巴基斯坦暴雨山洪致百人死亡

7月12日,巴基斯坦国家灾难管理局数据显示,连日暴雨和山洪引发多起事故。过去24小时新增2人死亡。自6月26日以来,极端天气已致100人死亡、185人受伤。免责声明: 本文内容由开放的智能模型自动生...

Win11新版本意外恢复Vista经典启动音引热议

微软近日向Canary频道推送了Windows 11 Build 27898预览版,带来任务栏按钮缩小、快速恢复等优化功能。然而,该版本"不小心"将Windows Vista的经典启动音重新引入系统,引发用户关注。此前在Dev...

刘震因个人原因不参加赣超联赛

2025年7月12日,南昌市体育局通报称,关于刘震担任南昌市队队长的说法与事实不符,球队队长实为龚左旭。经江西省足球协会严格审查,南昌队全体球员参赛资格符合规定,刘震因个人原因将不参加本次赣...

张朝阳与诺奖得主探讨AI创造力局限

7月11日,搜狐创始人张朝阳与诺贝尔物理学奖得主David Gross对谈时表示,当前AI不具备真正的创造力。David Gross认为,AI大模型若在数据库中找不到答案,便会编造内容,无法验证对错,也难以解决复...

全新零跑C11上市 售价14.98万起

2025年7月12日,全新零跑C11正式发布,定价区间为14.98-16.58万元。新车提供纯电与增程两种动力版本,其中纯电车型配备81.9kWh大容量电池,CLTC续航达640km,并标配全域800V高压碳化硅快充平台,30%...

WTT美国大满贯国乒冲双打决赛

北京时间2025年7月13日,WTT美国大满贯赛事进入收官日,将进行男双、女双决赛以及男女单打半决赛。中国乒乓球队将在多场比赛中出战,备受关注的女双决赛将由孙颖莎/王曼昱对阵王艺迪/蒯曼。此外,...