模型信息
输入价格
0.75 - 2.2 元
每百万tokens
输出价格
3 - 8.7 元
每百万tokens
上下文长度
131,072 - 131,072
tokens
模态
文字
→ 文字
实现思考模式和非思考模式的有效融合,可在对话中切换模式。推理能力以更小参数规模比肩QwQ-32B、通用能力显著超过Qwen2.5-14B,达到同规模业界SOTA水平。
供应商对比
共 4 家供应商提供此模型
| 供应商 | 输入价格 | 输出价格 | 上下文 | 吞吐量 | 延迟 | |
|---|---|---|---|---|---|---|
| 阿里云百炼 | 0.75 元 | 3 元 | 131,072 | 126.05 t/s | - | 访问 → |
| 快手万擎 | 0.75 元 | 3 元 | 131,072 | 74.56 t/s | - | 访问 → |
| SCNet | 1 元 | 6 元 | 131,072 | - | - | 访问 → |
| 无问芯穹 | 2.2 元 | 8.7 元 | 131,072 | 126.97 t/s | - | 访问 → |