最新最快科技资讯
太阳能光伏网

搜索

谷歌 DeepMind 推出 NaViT 模型 可显著减少训练时间

GoogleDeepMind推出了NaViT: 一种新的ViT模型,它在训练过程中使用序列打包来处理任意分辨率和宽高比的输入。该模型将图像分割成小块,并线性投影到令牌上,形成了这个模型的基础。NaViT在广泛的解决方案范围内都表现出色,为推理时间提供了平滑的性能-成本平衡,并且易于适应新任务无需花费大量资金。

工信部:加快打造从服务器、网络设备到数据加工、数据治理再到人工智能、 模型训练的算力产业链条

在2023中国算力大会新闻发布会上,工信部信息通信发展司司长谢存介绍,下一步,将以本次算力大会和第二届「西部数谷」算力产业大会为契机,在工信部等国家部委的指导支持下,抢抓国家「东数西算」重大机遇,以建设黄河流域生态保护和高质量发展先行区为牵引,努力打造千亿级数字产业集群,使之成为宁夏高质量...

这个新方法有点牛,无需数据训练就能改善Stable Diffusion

受到大型语言模型的微调的启发,研究人员现在正试图使用强化学习来微调生成AI模型以实现特定目标,例如提高图像的美学质量,从干预这一过程。伯克利人工智能研究中心的研究人员使用强化学习来进一步优化生成式人工智能模型用于改善图像生成的效果。与强化学习中常见的一样,DDPO也表现出奖励过度优化的现...

立方数科推出AI模型训练平台立方PAI

由立方数科自主研发的立方云PAI经国家版权局审核,符合《计算机软件保护条例》和《计算机软件著作权登记办法》的相关规定,认定为原始取得,成功获得《计算机软件著作权登记证书》。立方PAI提供完整的人工智能模型训练和资源管理能力平台,易于扩展,支持各种规模的on-premise、on-cloud和混合环境,并且提...

OpenAI 和美联社达成合作,用新闻文章训练AI

OpenAI与美联社宣布合作,将利用美联社的新闻文章训练人工智能。这是AI供应商与媒体机构之间的首次合作,OpenAI将获得美联社档案中的文本内容,用于训练大型语言模型。6月1日,美联社推出了人工智能搜索功能,利用软件供应商MerlinOne的技术,帮助用户更轻松地查找图像和视频。

国家网信办:生成式人工智能服务提供者应依法开展训练数据处理活动 使用具有合法来源的数据和基础模型

近日,国家网信办联合国家发展改革委、教育部、科技部、工业和信息化部、公安部、广电总局公布了《生成式人工智能服务管理暂行办法》。《办法》明确生成式人工智能服务提供者应当依法开展预训练、优化训练等训练数据处理活动,使用具有合法来源的数据和基础模型;涉及知识产权的,不得侵害他人依法享有...

七部门:推动生成式人工智能基础设施和公共训练数据资源平台建设

国家网信办等七部门联合公布《生成式人工智能服务管理暂行办法》。《办法》提出,鼓励生成式人工智能技术在各行业、各领域的创新应用,生成积极健康、向上向善的优质内容,探索优化应用场景,构建应用生态体系。鼓励生成式人工智能算法、框架、芯片及配套软件平台等基础技术的自主创新,平等互利开展国际...

谷歌受到诉讼 指控窃取了数百万用户的数据来训练人工智能工具

周二,科技巨头谷歌遭到了一场诉讼,指控该公司未经数百万用户同意就窃取了他们的数据,并违反了版权法,起诉谷歌使用这些数据来训练和开发其人工智能产品。这项针对谷歌、其母公司Alphabet和谷歌的人工智能子公司DeepMind的集体诉讼案于周二在加利福尼亚州的一家联邦法院提起,由ClarksonLawFirm发起。Gi...

OpenAI与图库网站Shutterstock续约六年 可用平台内图片、音乐训练

图库网站Shutterstock近日宣布与OpenAI延长合作伙伴关系,续签为期六年,同意OpenAI在此期间利用Shutterstock平台内的图片、视频和音乐进行AI模型的训练。Shutterstock与OpenAI的首次合作始于2021年,当时Shutterstock允许OpenAI使用其图像来训练文本生成图像模型DALL-E。Shutterstock此前已表示将对用...

Shutterstock与OpenAI延续合作六年 允许DALL-E用图库作品训练模型

图库网站Shutterstock将与OpenAI的合作伙伴关系再延长六年,允许OpenAI在此期间使用Shutterstock庞大的图库来训练其模型。Shutterstock首次与OpenAI合作始于2021年,当时Shutterstock允许OpenAI使用其图像来训练文本生成图像模型DALL-E,这对模型的训练至关重要。尽管通过与DALL-E的整合使图库得以增长,...

GPT-4模型架构、训练成本和数据集信息泄露

SemiAnalysis发布了一篇付费订阅的内容,「揭秘」了有关GPT-4的信息,包括模型架构、训练成本、数据集等。GPT-4是由8个混合专家模型组成的集成系统,每个模型有2200亿个参数。文章还介绍了A100上GPT-4的训练和推理成本,以及如何拓展到下一代模型架构H100。

李飞飞“具身智能”新成果!机器人接入大模型无需训练即可完成复杂指令

李飞飞团队的最新成果是一项名为VoxPoser的具身智能技术,可以使机器人直接听懂人类的自然语言指令并完成复杂任务,无需额外的数据和训练。这项技术通过将大语言模型和视觉语言模型结合,从3D空间中分析目标和障碍物,帮助机器人进行行动规划。该研究成果引起了学术界的广泛兴趣,并改变了一些人对于人工...

燧原科技帮助降低硬件接入AI模型训练和推理的门槛

燧原科技与上海人工智能实验室合作,基于人工智能开放计算体系-DeepLink共建AI软硬件生态,当前双方的合作主要基于燧原科技已量产的第二代训练产品云燧T20和第二代推理产品云燧i20。目前,T20和i20已基于DeepLink实现多个模型的训练和推理的适配,支持CV、NLP 等核心领域以及开源LLaMA大模型。双方的合作...

谷歌发言人:隐私政策更新没有从根本上改变其训练人工智能模型的方式

谷歌已更新其隐私政策以确认从互联网上获取公开数据来训练其人工智能模型和服务,包括其聊天机器人Bard和现在可以实时生成查询答案的搜索引擎。谷歌隐私政策的PDF版本中写道: 「谷歌使用信息来改善我们的服务,并开发惠及我们的用户和公众的新产品、功能和技术。其他网站如Shutterstock和Getty则选择将...

谷歌更新隐私政策,允许采用公共数据训练AI模型

自ChatGPT一类生成式AI推出以来,由于涉及利用互联网的数据来训练内容,这引起大量版权和隐私争议。谷歌日前就更新隐私政策规定,允许该公司采用互联网上的公共数据来训练旗下AI模型。据《界面新闻》报道,该政策提到,谷歌现时可通过收集网络上的公开信息或来自其他公共来源的讯息,来帮助训练谷歌的AI模...

腾讯将发布大模型训练自研向量数据库

腾讯云将于7月4日下午发布一款自主研发的向量数据库,该数据库主要面向大规模模型的训练。通过使用这款数据库,企业原先需要花费一个月时间才能完成的大模型接入工作,将缩短到三天时间,极大提升工作效率。该数据库已经在腾讯视频、QQ浏览器的AI检索和查询场景中得到了成功应用。