第一科技网

09 04月 2026

Meta发布全新AI大模型Muse Spark

2026年4月9日,美国科技公司Meta正式发布轻量级AI大模型Muse Spark。该模型面向多模态生成任务,支持文本、图像与简单视频理解与生成,主打低延迟与端侧部署能力。据官方介绍,Muse Spark已在内部测试中用于增强Messenger和Instagram的创意工具。此举旨在强化Meta在AIGC领域的竞争力,并加速AI功能向消费...

25 03月 2026

苹果将推独立Siri应用及对话式AI助手

苹果公司正测试独立Siri应用及全新"Ask Siri"功能,计划于2026年6月9日WWDC大会随iOS 27与macOS 27发布。该升级基于自研模型与谷歌Gemini合作技术,支持文本/语音双模对话、跨应用任务执行及个人数据调用。新界面整合至灵动岛与搜索系统,取代Spotlight,提供液态玻璃风格响应面板。独立App将支持对话历...

19 02月 2026

谷歌发布Lyria 3 AI音乐生成模型,免费开放使用

2026年2月19日,谷歌正式发布全新AI音乐生成模型Lyria 3。该模型支持生成30秒高保真音轨,适配广告曲、节拍及复杂编曲等多种风格。即日起登陆Gemini桌面端应用,18岁以上用户可免费使用,移动端将于数日内上线。模型支持英、德、西、法、印地、日、韩、葡八种语言,支持文本、图片、音频、视频多模态提示...

16 02月 2026

阿里低调上线Qwen3.5-Plus及Qwen3.5-397B-A17B两款新模型

2026年2月16日下午,阿里巴巴在chat.qwen.ai平台上线Qwen3.5-Plus与Qwen3.5-397B-A17B两款大语言模型。前者为Qwen 3.5系列最新闭源模型,后者为该系列开源旗舰模型。二者均支持文本理解与生成、多模态任务等能力。上线动作未举行发布会,属低调发布。此举旨在强化通义千问在高性能与开源生态双赛道的布...

14 02月 2026

DreamTech AI获君联资本等战略投资

2026年2月,深圳DreamTech AI追梦每刻公司宣布完成新一轮战略融资,投资方包括君联资本、南山战新投、力合科创与元禾原点。该公司专注原生3D生成AI技术研发,自主研发支持文本/单或多视图图像生成3D模型的通用模型,覆盖AR、VR、游戏、3D打印及动画等领域。此举旨在降低3D内容创作门槛与成本,推动个性化3...

10 02月 2026

字节推出AI视频模型Seedance2.0,60秒生成电影级多镜头视频

2026年2月上旬,字节跳动正式发布AI视频生成模型Seedance2.0。该模型支持文本或图像输入,60秒内生成带原生音频的多镜头序列视频。游戏科学CEO冯骥称其为"当前地表最强视频生成模型",并指出AIGC已结束童年时代。影视飓风创始人Tim实测视频引发广泛关注。因真人素材参考功能引发伦理与版权隐忧,字节已紧...

04 02月 2026

微软发布OfficePLUS V3.14更新,新增350+美化素材

2026年2月3日,微软上线OfficePLUS V3.14版本。本次更新推出超350款视觉美化素材,包括110+渐变配色方案(支持文本与形状填充及二次编辑)和240+图片边框素材(兼容剪裁与替换)。更新面向全体订阅用户,适用于作业、汇报、课件等多场景。OfficePLUS为微软官方设计资源服务,提供百万级模板及AI生成等高级功...

29 01月 2026

DeepSeek 加码多语言AI搜索与智能体技术布局

2026年1月,中国AI公司DeepSeek加速拓展AI产品矩阵。该公司近期发布超12个招聘岗位,聚焦多语言AI搜索引擎及自主运行智能体(agents)研发。新搜索引擎将支持文本、图像、音频等多模态输入；智能体平台强调长期运行能力与低人工干预。此举旨在强化其在通用人工智能(AGI)领域的竞争力,直面OpenAI与Alphabe...

15 01月 2026

OpenAI推ChatGPT独立翻译功能

北京时间2026年1月15日,OpenAI推出全新翻译功能"ChatGPT Translate",现已向所有用户免费开放。该功能通过chatgpt.com/translate网页端提供服务,支持文本、图片、语音及文件等多种输入方式,覆盖50多种语言。系统可自动识别语种或由用户手动选择翻译方向,输出侧重语义还原,并允许调整表达风格。与传统...

14 01月 2026

谷歌发布医疗AI模型MedGemma 1.5 4B

2026年1月14日,谷歌推出专为医疗场景设计的轻量化AI模型MedGemma 1.5 4B及语音识别模型MedASR。该模型可本地部署,支持文本与CT、MRI等三维影像数据的分析推理,准确率较前代提升。MedASR在医疗对话转录中错误率仅为5.2%,优于同类产品,并可与MedGemma系列集成。谷歌已免费开源MedGemma系列,助力开发者...

17 12月 2025

Adobe Firefly上线文本编辑视频功能

2025年12月17日,Adobe向其AI视频生成应用Firefly全面推送更新,新增支持文本指令精准编辑的视频编辑器,并引入Black Forest Labs的FLUX.2和Topaz Labs的Astra等第三方模型。此次更新使用户可直接通过文本修改视频中的元素、色彩与镜头角度,并支持时间轴操作。Firefly现可结合Runway的Aleph模型执行"将...

08 12月 2025

AI视频平台Pollo AI获1400万美元融资

2025年12月8日,AI视频生成平台Pollo AI宣布完成1400万美元种子轮融资,由高成资本领投,真格基金跟投。本轮融资为Pollo AI创立以来的首轮机构融资,将用于模型聚合平台建设、产品化升级及全球市场拓展。Pollo AI于2024年10月上线,集成Kling AI、Runway等主流模型,支持文本转视频、图像生成等多种功能,最...

22 11月 2025

谷歌正为Android开发通用剪贴板功能

2025年11月22日,据外媒消息,谷歌正在为Android系统开发类似苹果的通用剪贴板功能。该功能通过新增的UniversalClipboardManager类实现,目前处于测试阶段。复制文本后,Pixel系统服务将检测变化并广播至Google Play服务,再通过Handoff框架同步至Android PC。当前版本仅支持文本数据,忽略非文本内容。预...

24 09月 2025

三星One UI 8.5曝光:Galaxy AI功能升级助力高效操作

9月23日,消息源@nirmalsri7在X平台分享图片,透露三星One UI 8.5系统将引入多项Galaxy AI新功能。触控助手可优化屏幕文字阅读体验,智能剪贴板支持文本修正、摘要与翻译,提升信息处理效率。社交创作器能自动生成社交媒体内容,方便用户快速表达观点；会议助手则提供实时翻译,助力跨语言商务沟通。界面设...

07 08月 2025

ONLYOFFICE 9.0.4正式发布,新增AI智能体与多项实用功能

开源办公套件ONLYOFFICE日前推出9.0.4版本,正式引入AI智能体插件,支持文本摘要、改写、生成图表与解释专业术语等功能,用户还可通过API接入OpenAI、Mistral等模型。新版同时集成同义词词典、OCR识别、排版检查等多项实用插件,显著提升办公效率。编辑器在受限编辑区域的操作体验得到优化,并新增文档占...

06 08月 2025

谷歌DeepMind发布Genie 3世界模型推动AGI发展

谷歌DeepMind于8月5日宣布推出Genie 3世界模型,该模型能够模拟逼真的现实环境,使AI系统与之互动,标志着通用人工智能(AGI)研发迈出重要一步。Genie 3具备实时交互能力,可模拟物理世界、自然生态及奇幻场景,并支持历史与地理探索。相比前代模型,其一致性与真实感显著提升,能长时间保持环境稳定性,并支...

25 06月 2025

ElevenLabs推出独立移动应用支持文本转语音

语音人工智能公司 ElevenLabs 近日正式上线其独立移动应用,iOS 与 Android 用户现已可在移动端便捷地将文本转化为语音片段。此前该功能仅限于网页端操作,如今用户可随时随地生成所需音频内容。只需输入或粘贴文本并选择语音模型,即可完成语音合成。免费用户享有约10分钟的音频生成时长,并可在不同音...

05 06月 2025

OpenAI宣布GPT-5即将面世性能远超GPT-4及现有模型

[太平洋科技快讯]6月4日,两名OpenAI代表在墨西哥举办的 AI Summit 峰会上透露,GPT-5 即将面世,且性能将远超 GPT-4 等现有模型。他们坦言,目前尚不清楚开发成本,但暗示价格可能不低。其中一位代表强调: "我们希望通过 GPT-5 在竞争中占据更多优势"。据此前 OpenAI 透露的消息,GPT-5 的发布时间初步定...

27 03月 2025

阿里云发布多模态旗舰模型Qwen2.5-Omni,全面支持文本、图像、音频及视频处理

阿里云今日凌晨推出新一代端到端多模态模型Qwen2.5-Omni,并在Hugging Face、ModelScope等平台开源。该模型采用创新的Thinker-Talker架构,能无缝处理文本、图像、音频和视频输入,并实时生成文本及语音输出。Qwen2.5-Omni通过TMRoPE技术实现音视频精准同步,在实时交互与语音生成方面表现优异。测试显示...

18 04月 2023