Meta联合推出Multi-SpatialMLLM模型,突破多模态空间理解瓶颈
Meta公司与香港中文大学合作,近日推出Multi-SpatialMLLM模型,通过整合深度感知、视觉对应和动态感知三大组件,显著提升了多模态大语言模型(MLLMs)的空间理解能力。该模型依托超过2700万样本的MultiSPA数据集,涵盖多样化的3D和4D场景,并利用GPT-4o生成任务模板,有效解决了传统模型在动态信息处理上的局...
Meta公司与香港中文大学合作,近日推出Multi-SpatialMLLM模型,通过整合深度感知、视觉对应和动态感知三大组件,显著提升了多模态大语言模型(MLLMs)的空间理解能力。该模型依托超过2700万样本的MultiSPA数据集,涵盖多样化的3D和4D场景,并利用GPT-4o生成任务模板,有效解决了传统模型在动态信息处理上的局...
微软近日开源了名为Magentic-UI的浏览器Agent,可实时跟踪与控制智能体。该工具基于此前的Magentic-One开发,支持人机协同控制,显著提升了任务完成率和准确率。据GAIA测试数据,配备模拟用户后,任务完成率从30.3%提升至51.9%,准确率提高71%。同时,仅在10%的情况下需向用户求助,平均每次任务求助1.1次。...
[太平洋科技快讯]5月23日,Anthropic正式推出了其新一代语言模型——Claude Opus 4和Claude Sonnet 4。这两款模型均具备混合推理能力, 提供两种模式: “快速模式”(Fast Mode)用于低延迟的简短对话任务,“扩展思考模式”(Extended Thinking Mode)用于需要深度推理和多...
[太平洋科技快讯]近日,OpenAI 宣布,将推出基于其 o4-mini 模型的轻量版 Deep Research AI 搜索功能。此举旨在降低深度研究工具的使用门槛,使更多用户能够体验到 AI 赋能的在线研究能力。今年 2 月,OpenAI 推出了Deep Research 功能。为了满足更多用户的需求,OpenAI 决定推出“轻量版”Deep...
宾州州立大学研究团队开发了一种创新的贴片式设备,能够通过测量皮肤温度、心率等生理信号,揭示人们隐藏的真实情绪。这款类似创可贴大小的设备结合了柔性金属设计和多层传感器技术,可同时追踪多种情绪相关生理反应,如湿度、血氧水平等,且具备无线数据传输功能,确保隐私安全。研究表明,仅依赖面部表情...
大阪都会大学医学研究生院的研究团队近期发布了一项系统性回顾和荟萃分析,评估生成式人工智能在医疗诊断中的表现。研究筛选了18371项相关研究,最终对83项进行深入分析,涉及GPT-4、Llama3 70B等多款AI模型。结果显示,这些模型的平均诊断准确率为52.1%,部分模型的表现与非专家医生相当,但专家医生的准...
浪潮信息近日宣布,其元脑企智EPAI企业大模型开发平台已全面接入并支持DeepSeek大模型。这一合作使企业用户能够将业务数据与DeepSeek大模型深度融合,深度挖掘模型潜力,快速实现本地化部署,构建高准确率、安全稳定的专属智能应用。元脑企智EPAI与DeepSeek R1 671B的全面适配,进一步提升了企业智能化开...
2月12日,微软推出OmniParser最新版本V2.0,进一步强化了AI智能体对计算机的操控能力。作为一款基于纯视觉的GUI解析工具,OmniParser V2.0支持OpenAI、DeepSeek、Qwen和Anthropic等模型,使其能够精准识别屏幕上的可交互元素。与V1版本相比,V2.0通过更大规模的交互元素检测数据和图标功能标题数据进行训...
2025年2月12日,高途教育科技集团(以下简称"高途")正式宣布接入深度求索(DeepSeek)人工智能大模型,强化其在教研、教学、产品开发及内容创作等多个核心业务场景的深度应用,并计划在未来三个月陆续推出多项调优结果和更新功能。多年来,高途持续关注并探索人工智能大模型的发展,将其应用到能够提升运营效...
"你的图很好,但下一秒就是我的了。"我们经常能在某些梗图或表情包的评论区看到类似的玩笑,然而当盗图行为真实发生在社交软件中,其带来的后果可未必能有这么轻松。在如今的互联网时代,眼见不一定为实。部分不法分子利用科技盗取他人照片,建立包装出一个更有社交优势的虚假人设,利用此进行社交乃至诈骗...
12月27日,推想医疗发布消息,旗下肺部手术规划产品通过了国家药监局NMPA三类医疗器械审批。该产品用于肺部手术规划,是全球首个获批NMPA三类证的癌症手术治疗人工智能应用,也是首个且唯一一个获得NMPA三类证批准的肺部手术规划产品,可为胸外科医师制定肺部手术计划提供参考。据悉,该胸外科AI临床试验由...
12月27日,推想医疗发布消息,旗下肺部手术规划产品通过了国家药监局NMPA三类医疗器械审批。该产品用于肺部手术规划,是全球首个获批NMPA三类证的癌症手术治疗人工智能应用,也是首个且唯一一个获得NMPA三类证批准的肺部手术规划产品,可为胸外科医师制定肺部手术计划提供参考。据悉,该胸外科AI临床试验由...
近日,国务院国资委召开"AI赋能 产业焕新"中央企业人工智能专题推进会。会议指出,中央企业要把发展人工智能放在全局工作中统筹谋划,加快建设一批智能算力中心。事实上,人工智能(AI)技术已经成为人类社会中的重要组成部分,在各种领域都有着广泛的应用。其中,环境保护领域也是人工智能技术的重要应用地...
本文根据 2023 云栖大会演讲实录整理而成,演讲信息如下: 演讲人: 郭瑞杰 | 阿里云资深技术专家、搜索负责人演讲主题: 阿里云搜索产品智能化升级发布近日在2023云栖大会上,阿里云搜索负责人郭瑞杰对阿里云搜索产品智能化升级发布,在全场景的搜索细分领域,提供智能化产品能力,包括基于大模型的开放搜索...
导语: 2023年8月16日,在杭州市庆春桃元护理院三层会议室,由中华少年儿童慈善救助基金会与中科量子科技(无锡)有限公司共同举办了主题为"数字健康·科技向善"的"儿童大健康公益"战略合作签约仪式,此次活动的参加人员有企业家、科研专家、健康医学专家、慈善公益工作者、心理咨询专家、社会爱心团队和各...
中国数字经济呈现高速增长趋势,迈入存量时代的中国房地产市场集中度趋势凸显,呈现出"马太效应",企业之间的竞争愈演愈烈,数字化转型成为地产企业提高市场竞争力的必要手段。中国金茂的数字化转型开始早且进程快,在百望云等伙伴参与共建的业财税一体化平台上线后,中国金茂的业财税资基本业务操作整体提...
我们的生活早已与指纹识别技术息息相关了,你知道吗?正是由于指纹与生俱来的便捷性以及约1/150亿的超低重复率,指纹识别技术成为了当今应用最广泛的生物识别技术之一。日前,萨摩耶云科技集团研发技术团队联合深圳技术大学-大数据与互联网研究院合作论文《基于常规信息的移动设备指纹识别》已在权威期刊...
据Tech星球报道,支付宝正在研发"掌纹支付"功能,该项目从去年开始加速了研发进程,或将成为未来支付宝的一种全新支付方式。天眼查App显示,近期,支付宝(杭州)信息技术有限公司多个掌纹支付专利已获授权,包括掌纹识别设备、收银设备等。如"生物特征识别设备"专利,通过设置容纳腔,降低了外部环境对掌纹识...
随着人们生活水平的提高,情感需求逐渐超越了物质需求,不知从什么时候起,越来越多的年轻人爱上了养宠物。鉴于狗有非凡的嗅觉加上人在不同状态下会发出不同的气味,研究人员便想探寻狗是否能从人的气味中闻出主人的心理状态。近日,CNMO了解到,来自英国女王大学的研究人员发现,通过人呼吸和汗液发出的气...
近些年来,随着AI科技的迅速发展,很多企业都开始使用"智能客服",然而市面上众多智能客服在给企业带来价值的同时,也产生了一系列不够"聪明"的现象。在这样的背景下,作为AI NLP赛道的领头企业,竹间智能科技怎么样为企业降本增效,提升客户体验呢?竹间智能科技对于"智能客服"已探索钻研许久,现已率先跨入3...