最新最快科技资讯
太阳能光伏网

搜索

苹果获批事件相机专利,手势识别技术迎突破

据科技媒体 patentlyapple 报道,苹果公司于4月29日获得一项新专利,涉及先进的事件相机系统,该系统或将在未来应用于MacBook设备。相比传统相机因帧率较低难以捕捉快速手势动作的问题,事件相机能够逐像素记录动态变化,大幅提高数据采集速度。然而,在复杂环境中,无关事件的干扰数据可能降低识别效率。为...

谷歌DeepMind推出QuestBench基准,评估AI模型识别信息缺口能力

谷歌DeepMind团队近日推出QuestBench新基准,旨在通过约束满足问题(CSPs)框架,评估大型语言模型(LLMs)在推理任务中识别和获取缺失信息的能力。该研究针对现实场景中信息不完备的挑战,如用户提问遗漏细节或机器人在部分可观测环境中工作,强调模型需主动识别信息缺口并生成针对性澄清问题。QuestBench覆...

Mary应用整合多款顶级AI模型 一站式解决创作与识别需求

近日,移动应用Mary正式登陆App Store,为用户提供集成ChatGPT、Mistral、Llama和Gemma等顶级AI模型的一站式服务平台。无论是文本创作、图像生成还是视频制作,用户均可通过该应用快速调用不同AI工具,并对比结果以选择最佳方案。Mary支持利用Flux、Stable Diffusion和Recraft生成高清图像,并依托Kling平...

谷歌信息App测试AI敏感内容过滤功能 本地识别保护隐私

外媒9To5Google报道,谷歌信息App正测试"敏感内容警告"功能,通过本地AI技术自动识别并模糊处理敏感图片。该功能在收发消息时均会生效: 接收端自动为可疑图片打码,用户需手动选择查看或删除;发送端则会在检测到风险内容时提示确认。谷歌强调,识别过程依托Android System SafetyCore在设备端完成,无需...

Meta利用AI技术识别Instagram虚假年龄账户,强化青少年保护措施

Meta公司近日宣布,正通过人工智能技术识别Instagram上隐瞒真实年龄的青少年用户,确保他们无法绕过平台的安全保护机制。若系统检测到账户可能属于青少年,即使填写的是成人生日,也会强制将其纳入受限的"青少年账户"模式。该模式于去年推出,旨在限制青少年用户的社交互动及内容访问权限,16岁以下用户修...

谷歌安卓16 Beta 4更新提升折叠屏状态识别精度

科技媒体Android Authority报道,谷歌在安卓16 Beta 4更新中新增"robust open/close detection"设置,旨在优化Pixel Fold和Pixel 9 Pro Fold的折叠状态识别能力。该功能位于系统设置的显示与触控选项中,通过增强铰链角度传感器的可靠性,解决磁性保护壳可能导致的误判问题。折叠屏设备通常配...

ChatGPT图像识别功能引发隐私担忧,用户借AI技术破解照片拍摄地点

据外媒报道,随着OpenAI推出具备图像推理功能的o3和o4-mini模型,越来越多用户开始利用ChatGPT分析照片细节,推测拍摄地点。新模型不仅能识别模糊或变形的图像,还能结合网页搜索功能,推断城市、地标甚至具体场所。这一功能迅速在社交平台上扩散,用户上传菜单、街景甚至自拍照,模拟地理猜谜游戏GeoGuessr...

抖音升级“验证助手”助用户识别“真假客服”

近日,抖音黑板报官方微博宣布,平台对"验证助手"工具进行了升级,旨在进一步提升用户的防诈反诈能力。新功能主要包括两方面: 一是官方客服记录查询,用户可随时通过"验证助手"查看与官方客服的通话及短信记录。若接到自称"抖音客服"的来电,但查询无相关记录,则可判定为"假客服"。二是风险电话智能研判,...

安卓系统全面升级生物识别安全防护 谷歌三星率先部署“身份检查”功能

谷歌在2024年12月通过Pixel Feature Drop为Pixel系列手机引入"身份检查"功能,旨在强化设备防盗能力。三星随后在基于Android 15的One UI 7中整合该功能,其他安卓设备则需等待Android 16更新。"身份检查"要求用户在修改关键安全设置或访问敏感数据时,必须通过生物识别验证(如指纹),且无法回退至PIN码或...

航空业迎重大变革:面部识别技术将取代传统登机牌

国际民用航空组织(ICAO)近日提议,未来乘客仅需通过面部识别技术即可完成机场全流程通行,传统登机牌和值机方式或将成为历史。根据ICAO计划,新推出的"数字旅行凭证"系统允许旅客在移动设备上存储护照信息,并通过"旅程通行证"自动更新行程。乘客在机场通过面部扫描即可完成身份验证,航空公司将实时接收...

五菱发布“灵语座舱” 内置AI大模型支持方言识别

五菱汽车正式发布"灵语座舱"系统,其核心功能搭载了灵语AI中枢大模型,通过多项技术创新实现智能交互体验。该系统采用语义拼接、知识蒸馏等先进技术,支持多音区对话分离和"1+N"大模型架构。据悉,该系统在语言识别方面表现突出,可精准识别8种方言及12种重口音,识别率超过95%。除基础语音交互外,"灵语座...

Hi Auto获1500万美元A轮融资 推动汽车语音识别技术升级

近日,汽车语音识别系统研发商Hi Auto宣布完成1500万美元A轮融资,投资方包括Delek Motors、Vasuki Tech Fund等多家机构。该公司自主研发的噪音分离与语音增强技术,可精准识别驾驶员声音,有效屏蔽车内外的噪音干扰,解决了传统音频技术难以消除的复杂噪声问题。Hi Auto的创新方案提升了车载语音交互的准...

Qneiform获300万欧元融资,助力企业精准识别人才差距

招聘服务提供商Qneiform近日宣布完成300万欧元融资,本轮融资由PROfounders和DayOne Capital共同领投,现有投资者Keen Ventures及DFF Ventures(前身为Dutch Founders Fund)跟投。Qneiform通过行业数据集与专属AI模型,帮助企业快速测试人才团队、识别能力缺口,并依据战略目标匹配理想候选人。这一创新模...

OpenAI推出新一代语音模型 重点提升复杂环境识别和处理能力

[太平洋科技快讯]近日,OpenAI宣布推出一系列创新的语音模型,包括gpt-4o-transcribe、gpt-4o-mini-transcribe和gpt-4o-mini-tts,这些模型在语音识别和处理方面取得了显著突破。OpenAI此次推出的gpt-4o-mini模型,以其高性价比和强大功能脱颖而出。该模型在成本上较GPT-4o降低了96%至97%,同时比GPT-3.5 ...

美纳里尼与VisualDx合作推进BPDCN早期识别

美纳里尼及其子公司Stemline正携手VisualDx,通过人工智能和机器学习技术提升对BPDCN(浆细胞样树突状细胞肿瘤)的早期识别能力。此次合作旨在将BPDCN皮肤病变的实际图像整合至VisualDx平台,并借助AI/ML工具实现更精准的鉴别诊断。这一创新举措不仅强化了BPDCN的早期发现可能性,也为医疗领域引入了先进...

苹果折叠屏iPad Pro或于2027年面世,配备18.8英寸屏下3D人脸识别技术

据博主数码闲聊站透露,苹果正在开发一款名为Foldable iPad Pro的折叠屏产品,工程机屏幕尺寸达到18.8英寸,并内置金属超构透镜。该设备将集成Face ID的接收和发射模块,实现屏下3D人脸识别功能。这一创新设计不仅提升了用户体验,还为未来的折叠屏设备设定了新的标准。市场调研机构DSCC早前发布的报告也...

Mistral AI推出全新OCR API,领跑光学字符识别领域

Mistral AI于6日正式发布了Mistral OCR API,宣称其在光学字符识别(OCR)领域表现卓越。该API具备强大的多模态文档处理能力,能够从PDF、幻灯片、数学表达式、LaTeX学术文档等复杂文档中高效提取文本内容,并以Markdown文件的形式清晰呈现。Mistral OCR模型支持解析、理解和转录数千种脚本、字体和语言,...

水晶光电3.23亿收购埃科思科技,加码生物识别与智能设备领域

水晶光电今日发布公告,拟以自有及自筹资金3.23亿元人民币,收购广东埃科思科技有限公司95.60%的股权。埃科思科技专注于生物识别产业,提供全方位解决方案,主营3D和2D模组的研发、制造与销售,涵盖结构光、飞行时间ToF、主动双目等高端相机技术,以及车载摄像头模组。其产品广泛应用于金融支付、智能物联...

TÜV莱茵验证鹿客智能门锁掌静脉识别技术卓越性能

近日,TÜV莱茵为鹿客最新推出的智能门锁Veno Pro Palm Vein Recognition Video Smart Lock颁发了掌静脉识别率和识别速度验证声明。在TÜV莱茵自有实验室的严格测试中,Veno Pro展现了卓越的识别性能,平均识别时间不超过0.17秒,平均识别成功率高达99.9%以上。这一结果表明,Veno Pro在掌静脉识别技术上...

微软简化截图工具OCR功能,提升文字识别效率

近日,博主PhantomOfEarth在X平台透露,微软正在测试一项简化截图工具OCR功能的新特性。用户无需先截图,只需选取指定区域即可直接进入文字识别环节,大幅提升了操作效率。此前,用户需要通过截图工具截取区域,再进入图片编辑页面进行文本识别,步骤较为繁琐。微软自2023年9月在Windows 11中引入OCR功能后,...