2025年12月6日 星期六

超越极限,通义千问再升级:Qwen3-VL 系列 4B 与 8B 模型震撼开源上线

突破视觉边界,Qwen3-VL 系列开启多模态新纪元

阿里通义 Qwen3-VL 4B 8B 模型开源

​​唠唠资讯2025年10月15日 14:00消息,阿里通义Qwen3-VL系列新增4B与8B模型,性能超越GPT-5 Nano,全面开源。

   10月15日,阿里通义正式宣布推出Qwen3-VL系列的新成员——采用Dense架构的Qwen3-VL-8B和Qwen3-VL-4B模型,并已开源上线。

   Qwen3-VL-4B/8B 是一种密集(Dense)视觉理解模型,其显存占用更少,同时具备 Qwen3-VL 的全部功能,每个版本都包含 Instruct 和 Thinking 两种模式。

   Qwen3-VL-8B在STEM、VQA、OCR、视频理解和Agent等任务的公开评测中表现出色,不仅超过了Gemini2.5FlashLite和GPT-5Nano,还能与上一代超大模型Qwen2.5-VL-72B相媲美。

   而 4B 版本则在端侧展现更高的性价比,适合在需要 AI 视觉理解的智能终端部署。

   值得一提的是,这两款视觉理解模型在“视觉精准”与“文本稳健”方面实现了协同提升:针对小模型普遍存在的“跷跷板”现象(提升视觉能力通常会牺牲文本性能,反之亦然),阿里通过架构创新和技术创新,使模型在保持文本理解能力的基础上,进一步提升了多模态感知与视觉理解能力,实现了在较小规模下具备更强的视觉与文本处理能力。

   新模型现已在魔搭社区和HuggingFace平台上正式发布,同时提供了FP8版本,开源代码地址如下:

   https://modelscope.cn/collections/Qwen3-VL-5c7a94c8cb144b

   https://huggingface.co/collections/Qwen/qwen3-vl-68d2a7c1b8a8afce4ebd2dbe

相关阅读

微软紧急辟谣:AI销售目标被误读为硬性配额,实际为动态增长指引
联想杨元庆:2026年1月6日将发布个人超级智能体
AI火眼金睛上线!抖音直播严打低俗诱导,8.8万用户遭处罚
华为WATCH ULTIMATE DESIGN紫金款震撼登场:明日开启预售,智能腕表新标杆

发表评论

请输入您的姓名
请输入有效的邮箱地址
请填写评论内容

人工智能AI栏目

唠唠资讯人工智能AI栏目为您提供第一时间的新闻报道、深度分析和独家视角。

即时资讯

全天候更新热点事件,第一时间传递重要新闻

深度分析

专业团队解读事件背景与深层影响

24小时热文

友情链接

与优秀科技平台合作,共同构建创新数字生态

合作伙伴持续增加中,期待与更多优秀平台建立联系