QwQ-32B

文本生成

模型信息

输入价格 1 - 2 元 每百万tokens
输出价格 4 - 6 元 每百万tokens
上下文长度 32,768 - 131,072 tokens
模态 文字 → 文字
工具调用 Tools 推理

基于Qwen2.5-32B模型训练的QwQ推理模型,通过强化学习大幅度提升了模型推理能力。模型数学代码等核心指标(AIME 24/25、livecodebench)以及部分通用指标(IFEval、LiveBench等)达到DeepSeek-R1 满血版水平,各指标均显著超过同样基于 Qwen2.5-32B 的 DeepSeek-R1-Distill-Qwen-32B。

供应商对比

供应商 输入价格 输出价格 上下文 吞吐量 延迟
模力方舟 1 元 4 元 32,768 24.32 t/s - 访问 →
SCNet 1 元 4 元 32,768 - - 访问 →
蓝耘元生代 1 元 4 元 40,960 41.81 t/s - 访问 →
并行智算云 1.5 元 6 元 32,768 - - 访问 →
阿里云百炼 2 元 6 元 131,072 46.45 t/s - 访问 →
百度智能云 2 元 6 元 32,768 36.43 t/s - 访问 →
SophNet 2 元 6 元 131,072 47.70 t/s - 访问 →
七牛云 2 元 6 元 131,072 49.05 t/s - 访问 →
UCloud 2 元 6 元 131,072 35.84 t/s - 访问 →
零克云 2 元 6 元 131,072 - - 访问 →