Qwen3-8B

文本生成

模型信息

输入价格 0 - 0.5 元 每百万tokens
输出价格 0 - 2 元 每百万tokens
上下文长度 32,768 - 131,072 tokens
模态 文字 → 文字
工具调用 Tools 推理

实现思考模式和非思考模式的有效融合,可在对话中切换模式。推理能力达到同规模业界SOTA水平、通用能力显著超过Qwen2.5-7B。

供应商对比

供应商 输入价格 输出价格 上下文 吞吐量 延迟
硅基流动 免费 免费 131,072 30.48 t/s - 访问 →
模力方舟 免费 免费 32,768 46.94 t/s - 访问 →
阿里云百炼 0.5 元 2 元 131,072 76.40 t/s - 访问 →
百度智能云 0.5 元 2 元 32,768 70.63 t/s - 访问 →
快手万擎 0.5 元 2 元 131,072 52.94 t/s - 访问 →