DeepSeek-R1

文本生成

模型信息

输入价格 4 - 4 元 每百万tokens
输出价格 16 - 16 元 每百万tokens
上下文长度 65,536 - 147,456 tokens
模态 文字 → 文字
工具调用 Tools 推理

DeepSeek-R1-Zero 和 DeepSeek-R1 属于第一代推理模型。 DeepSeek-R1-Zero 通过大规模强化学习(RL)进行训练,未将监督微调(SFT)作为初步步骤,在推理方面展现出卓越性能。通过 RL,模型自然涌现出多种强大且有趣的推理行为。然而,该模型也面临无限重复、可读性差和语言混合等挑战。 为解决这些问题并进一步提升推理性能,引入了 DeepSeek-R1。该模型在 RL 之前加入了冷启动数据,从而在数学、代码和推理任务上取得了与 OpenAI-o1 相当的表现。

供应商对比

供应商 输入价格 输出价格 上下文 吞吐量 延迟
阿里云百炼 4 元 16 元 131,072 40.16 t/s - 访问 →
PPIO派欧云 4 元 16 元 65,536 27.95 t/s - 访问 →
百度智能云 4 元 16 元 147,456 27.73 t/s - 访问 →
七牛云 4 元 16 元 65,536 24.94 t/s - 访问 →
并行智算云 4 元 16 元 65,536 - 0.49 秒 访问 →
快手万擎 4 元 16 元 131,072 23.45 t/s - 访问 →
腾讯云 4 元 16 元 98,304 26.14 t/s - 访问 →