最新最快科技资讯
太阳能光伏网

搜索

英伟达H100霸榜权威AI性能测试,10分钟搞定GPT-3大模型训练

27日,机器学习及人工智能领域开放产业联盟MLCommons披露两项MLPerf基准评测的最新数据,其中英伟达H100芯片组在人工智能算力表现的测试中,刷新了所有组别的纪录,也是唯一一个能够跑完所有测试的硬件平台。对于这个结果,英特尔表示,理论上只要堆更多的芯片,运算的结果就会更快。

微软推出ZeRO++技术,可显著减少AI大模型训练时间和成本

据微软官方消息,微软研究人员日前推出了名为 ZeRO++ 的新技术,可显著减少大模型训练时间和成本。ZeRO++ 建立在 ZeRO 传输技术基础上,提供增强的通信策略,可提高训练效率,同时减少训练时间和成本。ZeRO++ 可对权重进行量化,其利用基于块的量化方法来保持训练精度,这种优化的量化过程相对原始 Zero 传...

微软推ZeRO++新系统:减少大模型训练时间和成本

微软研究人员推出了名为ZeRO的新系统,用于优化训练大型AI模型,以应对高数据传输开销和有限带宽的难题。ZeRO建立在现有的ZeRO优化的基础上,并提供增强的通信策略,以提高训练效率,减少训练时间和成本。研究人员和实践者可以利用ZeRO更有效地训练像ChatGPT这样的模型,并在AI领域探索新的可能性。

特斯拉专为 AI 机器学习和视频训练而构建 Dojo 超级计算机将于七月开始投产

特斯拉表示,备受期待的Dojo超级计算机将于下个月开始投产,这将使其自动驾驶技术达到一个新的水平。Dojo是特斯拉自主开发的定制超级计算机平台,专为AI机器学习和视频训练构建,利用来自其车队的视频数据进行训练。否则特斯拉可能需要多年时间才能实现真正的自主驾驶马斯克似乎坚信今年会实现这一目标。

沐曦GPU芯片功能测试完成 用于AI训练及通用计算

上海的GPU创新企业沐曦MetaX宣布,仅仅5个小时就完成了曦云MXC500芯片的功能测试,并且MXMACA2.0计算平台的基础测试也完成了。沐曦致力于为异构计算提供安全可靠的GPU芯片及解决方案,打造全栈GPU芯片产品,其中MXN系列GPU用于AI推理,MXC系列GPU用于AI训练及通用计算,以及MXG系列GPU用于图形渲染。沐曦的...

研究人员警告:用AI生成的内容训练AI,可能会出现“模型崩溃”

随着越来越多的人使用AI来制作和发布内容,一个明显的问题出现了: 当AI生成的内容在互联网上激增并且AI模型开始使用AI生成的内容进行训练,会发生什么?来自英国和加拿大的一组研究人员已经研究了这个问题,并且最近在开放获取期刊arXiv上发表了一篇相关论文。他们的发现令当前的生成式AI技术及其未来令...

起底网红去世涉事减肥训练营 网红去世涉事减肥俱乐部刚成立3月 涉事减肥训练营回应网红去世

据报道,近日,312斤女网红"翠花要逆袭"在一家减肥训练营不幸离世。据知情人介绍,"翠花"于5月25日来到陕西华阴一家名为"青健健身俱乐部"的减肥训练营。目前,训练营已赔偿家属并达成和解,事件具体原因正调查。天眼查App显示,华阴市青健健身俱乐部成立于今年3月,是一家个体工商户,经营者为王某某,注册地...

OpenAI CEO:OpenAI还没有开始训练GPT-5大模型

OpenAI 首席执行官 Sam Altman 在印度经济时报主办的一场会议上表示,该公司仍未开始训练 GPT-4 的后继者 GPT-5。Altman 说: "在我们开始训练这个模型之前,我们还有很多工作要做。我们正在研究我们认为需要的新想法,但我们肯定还没有准备好开始。"

Sam Altman :OpenAI 仍未开始训练大型语言模型 GPT-5

在微软支持下的OpenAI创业公司承诺在GPT-4后的继任者GPT-5上「一段时间内」不进行研发,这让许多行业高管和学者对SamAltman领导的大型语言模型的快速发展表示担忧,但几个月过去了,OpenAI仍未开始训练GPT-5。OpenAI首席执行官Altman在印度报纸《经济时报》主办的一次会议上表示: 「在我们启动那个模型...

日本政府表态:不会对AI训练使用的数据实施版权保护

日本政府方面,最近重申不会对人工智能训练中使用的数据实施版权保护。该政策允许AI使用任何数据,"无论是出于非营利或商业目的,是否是复制以外的行为,也无论是从非法网站或其他方式获得的内容。可见日本的立场很明确--如果西方用日本文化来训练人工智能,那么西方文学资源也应该可以用于日本人工智能。

OpenAI 采用新方法训练 AI 模型 以应对人工智能产生的「幻觉」

OpenAI于当地时间周三宣布,他们正在采用一种新的方法来训练人工智能模型,以应对人工智能产生的「幻觉」。此项研究的推出正值AI系统产生的错误信息比以往任何时候都更加引发热议,尤其是在生成式AI蓬勃发展的同时,以及2024年美国总统大选临近之际。在人们处于模型直接影响下的情况下,仍然存在着巨大的...

朗玛信息:基于AI大模型训练 成功开发“朗玛·39AI全科医生”

朗玛信息在5月28日发布公告称,成功开发出拥有自主知识产权的医疗健康人工智能产品--"朗玛.39AI全科医生"。该产品基于人工智能大模型训练,并形成人工智能"医生大脑",可被广泛应用于基层医疗卫生机构,为全科医生提供人工智能服务,包括辅助诊断、健康咨询和健康管理,提升基层医务人员诊疗水平,为用户提...

周鸿祎训练数字人代替演讲!直言有危机感 不想被数字人“干掉”

快科技5月28日消息,近日,2023黑马AIGC产业大会在北京举行,有关注大会的同学可能发现了,360集团创始人周鸿?是以数字人的方式出席大会。今日,周鸿?表示,黑马的会因嗓子哑了不能到场,正好训练了一个数字人,派他替我演讲,听说他一出场观众都乐了,说比我本人温柔,看来他挺受欢迎。周鸿?直言,这也让他多少...

周鸿?训练数字人代替演讲!直言有危机感 不想被数字人“干掉”

快科技5月28日消息,近日,2023黑马AIGC产业大会在北京举行,有关注大会的同学可能发现了,360集团创始人周鸿?是以数字人的方式出席大会。今日,周鸿?表示,黑马的会因嗓子哑了不能到场,正好训练了一个数字人,派他替我演讲,听说他一出场观众都乐了,说比我本人温柔,看来他挺受欢迎。周鸿?直言,这也让他多少...

全国首个DNA存储领域预训练大模型“ChatDNA”发布

5月21日,2023祥符创新论坛转化医学产业高峰论坛在浙江嘉善举办。上海人工智能研究院、祥符实验室、转化医学国家科学中心联合重磅发布全国首个DNA存储领域预训练大模型"ChatDNA"。会上还围绕精准医学及生命科学前沿热点问题,诊断技术、基因测序、DNA存储、医学人工智能、生物材料及药物研发等前沿领域...