阿里通义千问团队近日发布新一代视觉推理模型QVQ-Max,该模型在图片和视频内容的理解与分析上表现出色。不仅能够识别关键元素,还能结合背景知识进行深入推理,提供更具价值的结论。QVQ-Max的核心能力涵盖细致观察、深入推理及灵活应用三大方面。它不仅能解析复杂图表或日常照片中的细节,还能完成插画设计、短视频脚本生成等创作任务。
此外,QVQ-Max在职场、学习和生活场景中均有广泛应用。无论是协助数据分析、解答学科难题,还是推荐穿搭方案、指导烹饪,都能为用户提供高效支持。目前,用户可通过Qwen Chat体验其功能,只需上传图片或视频并提出问题,即可获得智能推理结果。阿里巴巴表示,未来将持续优化QVQ-Max的性能,进一步拓展其功能边界。