DeepSeek-V4-Flash

文本生成

模型信息

输入价格 0.02 - 1 元 每百万tokens
输出价格 2 - 2 元 每百万tokens
上下文长度 1,024,000 - 1,048,576 tokens
模态 文字 → 文字

DeepSeek V4 Flash 是 DeepSeek 开发的效率优化的专家混合模型,拥有 284B 总参数量和 13B 激活参数量,支持 1M Token的上下文窗口。它专为快速推理和高吞吐量工作负载设计,同时保持强大的推理和编码性能。 该模型包含混合注意力机制,用于高效处理长上下文,并支持可配置的推理模式。它非常适合需要响应速度和成本效率的应用,例如编码助手、聊天系统和Agent工作流。

供应商对比

供应商 输入价格 输出价格 上下文 吞吐量 延迟
阿里云百炼 1 元 2 元 1,024,000 74.87 t/s - 访问 →
PPIO派欧云 1 元 2 元 1,048,576 95.52 t/s - 访问 →
模力方舟 1 元 2 元 1,024,000 76.78 t/s - 访问 →
硅基流动 1 元 2 元 1,024,000 76.64 t/s - 访问 →
七牛云 1 元 2 元 1,024,000 68.12 t/s - 访问 →
SophNet 1 元 2 元 1,024,000 94.61 t/s - 访问 →
百度智能云 1 元 2 元 1,024,000 40.12 t/s - 访问 →
无问芯穹 1 元 2 元 1,024,000 103.54 t/s - 访问 →
UCloud 1 元 2 元 1,024,000 100.49 t/s - 访问 →
并行智算云 1 元 2 元 1,024,000 90.88 t/s - 访问 →
基石智算 1 元 2 元 1,024,000 54.41 t/s - 访问 →
金山云星流 1 元 2 元 1,024,000 91.47 t/s - 访问 →
华为云 1 元 2 元 1,024,000 28.65 t/s - 访问 →
DeepSeek 1 元 2 元 1,024,000 90.83 t/s - 访问 →