模型信息
输入价格
4 - 4 元
每百万tokens
输出价格
16 - 16 元
每百万tokens
上下文长度
65,536 - 147,456
tokens
模态
文字
→ 文字
DeepSeek-R1-Zero 和 DeepSeek-R1 属于第一代推理模型。 DeepSeek-R1-Zero 通过大规模强化学习(RL)进行训练,未将监督微调(SFT)作为初步步骤,在推理方面展现出卓越性能。通过 RL,模型自然涌现出多种强大且有趣的推理行为。然而,该模型也面临无限重复、可读性差和语言混合等挑战。 为解决这些问题并进一步提升推理性能,引入了 DeepSeek-R1。该模型在 RL 之前加入了冷启动数据,从而在数学、代码和推理任务上取得了与 OpenAI-o1 相当的表现。
供应商对比
共 7 家供应商提供此模型
| 供应商 | 输入价格 | 输出价格 | 上下文 | 吞吐量 | 延迟 | |
|---|---|---|---|---|---|---|
| 阿里云百炼 | 4 元 | 16 元 | 131,072 | 40.16 t/s | - | 访问 → |
| PPIO派欧云 | 4 元 | 16 元 | 65,536 | 27.95 t/s | - | 访问 → |
| 百度智能云 | 4 元 | 16 元 | 147,456 | 27.73 t/s | - | 访问 → |
| 七牛云 | 4 元 | 16 元 | 65,536 | 24.94 t/s | - | 访问 → |
| 并行智算云 | 4 元 | 16 元 | 65,536 | - | 0.49 秒 | 访问 → |
| 快手万擎 | 4 元 | 16 元 | 131,072 | 23.45 t/s | - | 访问 → |
| 腾讯云 | 4 元 | 16 元 | 98,304 | 26.14 t/s | - | 访问 → |