模型信息
输入价格
0.02 - 1 元
每百万tokens
输出价格
2 - 2 元
每百万tokens
上下文长度
1,024,000 - 1,048,576
tokens
模态
文字
→ 文字
DeepSeek V4 Flash 是 DeepSeek 开发的效率优化的专家混合模型,拥有 284B 总参数量和 13B 激活参数量,支持 1M Token的上下文窗口。它专为快速推理和高吞吐量工作负载设计,同时保持强大的推理和编码性能。 该模型包含混合注意力机制,用于高效处理长上下文,并支持可配置的推理模式。它非常适合需要响应速度和成本效率的应用,例如编码助手、聊天系统和Agent工作流。
供应商对比
共 14 家供应商提供此模型
| 供应商 | 输入价格 | 输出价格 | 上下文 | 吞吐量 | 延迟 | |
|---|---|---|---|---|---|---|
| 阿里云百炼 | 1 元 | 2 元 | 1,024,000 | 74.87 t/s | - | 访问 → |
| PPIO派欧云 | 1 元 | 2 元 | 1,048,576 | 95.52 t/s | - | 访问 → |
| 模力方舟 | 1 元 | 2 元 | 1,024,000 | 76.78 t/s | - | 访问 → |
| 硅基流动 | 1 元 | 2 元 | 1,024,000 | 76.64 t/s | - | 访问 → |
| 七牛云 | 1 元 | 2 元 | 1,024,000 | 68.12 t/s | - | 访问 → |
| SophNet | 1 元 | 2 元 | 1,024,000 | 94.61 t/s | - | 访问 → |
| 百度智能云 | 1 元 | 2 元 | 1,024,000 | 40.12 t/s | - | 访问 → |
| 无问芯穹 | 1 元 | 2 元 | 1,024,000 | 103.54 t/s | - | 访问 → |
| UCloud | 1 元 | 2 元 | 1,024,000 | 100.49 t/s | - | 访问 → |
| 并行智算云 | 1 元 | 2 元 | 1,024,000 | 90.88 t/s | - | 访问 → |
| 基石智算 | 1 元 | 2 元 | 1,024,000 | 54.41 t/s | - | 访问 → |
| 金山云星流 | 1 元 | 2 元 | 1,024,000 | 91.47 t/s | - | 访问 → |
| 华为云 | 1 元 | 2 元 | 1,024,000 | 28.65 t/s | - | 访问 → |
| DeepSeek | 1 元 | 2 元 | 1,024,000 | 90.83 t/s | - | 访问 → |