Qwen3.5-4B

视觉理解

模型信息

输入价格 0 - 0 元 每百万tokens
输出价格 0 - 0 元 每百万tokens
上下文长度 262,144 - 262,144 tokens
模态 文字, 图片, 视频 → 文字

Qwen3.5-4B 是通义千问团队推出的原生多模态大语言模型,拥有 4B 参数,是 Qwen3.5 系列中最轻量的 Dense 模型。该模型采用门控 Delta 网络与门控注意力相结合的高效混合架构,原生支持 256K 上下文长度,并可扩展至约 100 万 tokens。模型通过早期融合训练实现了统一的视觉语言基础能力,支持文本、图像和视频理解,在同规模模型中表现优异,多项指标超越 GPT-5-Nano 和 Gemini-2.5-Flash-Lite。模型默认启用思考模式(Thinking Mode),支持工具调用,并覆盖 201 种语言和方言

供应商对比

供应商 输入价格 输出价格 上下文 吞吐量 延迟
硅基流动 免费 免费 262,144 47.27 t/s - 访问 →