MiMo-V2-Flash

文本生成

模型信息

输入价格 0.7 - 2.1 元 每百万tokens
输出价格 2.1 - 8.4 元 每百万tokens
上下文长度 262,144 - 262,144 tokens
模态 文字 → 文字
工具调用 Tools

MiMo-V2-Flash是一个专为极致推理效率自研的总参数 309B(激活 15B)的 MoE 模型,通过 Hybrid 注意力架构创新及多层 MTP 推理加速,在多个 Agent 测评基准上保持进入全球开源模型 Top 2;代码能力超过所有开源模型,比肩标杆闭源模型 Claude 4.5 Sonnet,但推理成本仅为其 2.5%,生成速度提升 2 倍,成功将大模型推理效率推向极致。

供应商对比

供应商 输入价格 输出价格 上下文 吞吐量 延迟
PPIO派欧云 0.7 元 2.1 元 262,144 78.82 t/s - 访问 →
SophNet 0.7 元 2.1 元 262,144 - - 访问 →
七牛云 0.7 元 2.1 元 262,144 - - 访问 →
金山云星流 0.7 元 2.1 元 262,144 84.93 t/s - 访问 →
基石智算 2.1 元 8.4 元 262,144 2.10 t/s - 访问 →