Qwen3.5-Flash

视觉理解

模型信息

输入价格 0.2 - 0.2 元 每百万tokens
输出价格 2 - 2 元 每百万tokens
上下文长度 1,024,000 - 1,024,000 tokens
模态 文字, 图片, 视频 → 文字
工具调用 Tools 推理 视觉 Vision

Qwen3.5原生视觉语言系列Flash模型,基于混合架构设计,融合了线性注意力机制与稀疏混合专家模型,实现了更高的推理效率。模型效果在纯文本与多模态方面相较3系列均实现飞跃式进步;响应速度快,兼具推理速度和性能。

供应商对比

供应商 输入价格 输出价格 上下文 吞吐量 延迟
阿里云百炼 0.2 元 2 元 1,024,000 138.42 t/s - 访问 →