模型信息

输入价格 0 - 0 元每百万tokens

输出价格 0 - 0 元每百万tokens

上下文长度 262,144 - 262,144 tokens

模态文字, 图片, 视频 → 文字

Qwen3.5-4B 是通义千问团队推出的原生多模态大语言模型，拥有 4B 参数，是 Qwen3.5 系列中最轻量的 Dense 模型。该模型采用门控 Delta 网络与门控注意力相结合的高效混合架构，原生支持 256K 上下文长度，并可扩展至约 100 万 tokens。模型通过早期融合训练实现了统一的视觉语言基础能力，支持文本、图像和视频理解，在同规模模型中表现优异，多项指标超越 GPT-5-Nano 和 Gemini-2.5-Flash-Lite。模型默认启用思考模式（Thinking Mode），支持工具调用，并覆盖 201 种语言和方言

供应商对比

共 1 家供应商提供此模型

供应商	输入价格	输出价格	上下文	吞吐量	延迟
硅基流动	免费	免费	262,144	47.27 t/s	-	访问 →