最新最快科技资讯
太阳能光伏网

阿里通义推出Qwen3-VL系列新型号,Dense架构的Qwen3-VL-8B与Qwen3-VL-4B两款模型正式开源。新模型采用密集视觉理解架构,显著降低显存占用,同时完整保留Qwen3-VL系列的多模态能力,每个尺寸均提供Instruct和Thinking两种版本。

评测数据显示,Qwen3-VL-8B在STEM、VQA、OCR及视频理解等任务中表现卓越,不仅超越Gemini 2.5 Flash Lite与GPT-5 Nano,更可媲美上一代超大尺寸模型Qwen2.5-VL-72B。4B版本则面向端侧应用,具备更高部署性价比。

值得一提的是,两款模型通过架构创新解决了小模型常见的视觉与文本能力“跷跷板”问题,在强化多模态感知能力的同时保持了文本理解的稳健性,实现了视觉精准与文本稳健的协同突破。

免责声明:本文内容由开放的智能模型自动生成,仅供参考。

最新相关

全球最大游戏档案馆Myrient将于3月31日关停

全球最大在线游戏档案馆Myrient宣布将于2026年3月31日永久关闭。创始人称,因捐款不足、月均自付运营成本超6000美元(约4.1万元人民币),叠加AI热潮导致存储硬件价格飙升及基础设施升级受阻,已无...

2026年1月全国实际使用外资920.1亿元

2026年1月,全国实际使用外资920.1亿元人民币,同比下降5.7%;新设外商投资企业5306家,同比增长25.5%。制造业和服务业分别吸引外资260.9亿和640.4亿元;高技术产业引资337.5亿元,增长0.6%,占比...