DeepSeek-V4-Flash - AI模型价格对比 (2026/7/14)

模型信息

输入价格 0.02 - 1 元每百万tokens

输出价格 2 - 2 元每百万tokens

上下文长度 1,024,000 - 1,048,576 tokens

模态文字 → 文字

DeepSeek V4 Flash 是 DeepSeek 开发的效率优化的专家混合模型，拥有 284B 总参数量和 13B 激活参数量，支持 1M Token的上下文窗口。它专为快速推理和高吞吐量工作负载设计，同时保持强大的推理和编码性能。该模型包含混合注意力机制，用于高效处理长上下文，并支持可配置的推理模式。它非常适合需要响应速度和成本效率的应用，例如编码助手、聊天系统和Agent工作流。

供应商对比

共 16 家供应商提供此模型

供应商	输入价格	输出价格	上下文	吞吐量	延迟
阿里云百炼	1 元	2 元	1,024,000	54.52 t/s	-	访问 →
PPIO派欧云	1 元	2 元	1,048,576	67.74 t/s	-	访问 →
模力方舟	1 元	2 元	1,024,000	56.39 t/s	-	访问 →
硅基流动	1 元	2 元	1,024,000	26.65 t/s	-	访问 →
七牛云	1 元	2 元	1,024,000	54.56 t/s	-	访问 →
SophNet	1 元	2 元	1,024,000	88.95 t/s	-	访问 →
百度智能云	1 元	2 元	1,024,000	92.13 t/s	-	访问 →
并行智算云	1 元	2 元	1,024,000	26.23 t/s	-	访问 →
无问芯穹	1 元	2 元	1,024,000	64.34 t/s	-	访问 →
UCloud	1 元	2 元	1,024,000	67.98 t/s	-	访问 →
基石智算	1 元	2 元	1,024,000	29.00 t/s	-	访问 →
金山云星流	1 元	2 元	1,024,000	84.27 t/s	-	访问 →
蓝耘元生代	1 元	2 元	1,024,000	64.82 t/s	-	访问 →
华为云	1 元	2 元	1,024,000	29.38 t/s	-	访问 →
腾讯云TokenHub	1 元	2 元	1,024,000	72.76 t/s	-	访问 →
DeepSeek	1 元	2 元	1,024,000	71.35 t/s	-	访问 →