模型信息

输入价格 0.7 - 2.1 元每百万tokens

输出价格 2.1 - 8.4 元每百万tokens

上下文长度 262,144 - 262,144 tokens

模态文字 → 文字

工具调用 Tools

MiMo-V2-Flash是一个专为极致推理效率自研的总参数 309B（激活 15B）的 MoE 模型，通过 Hybrid 注意力架构创新及多层 MTP 推理加速，在多个 Agent 测评基准上保持进入全球开源模型 Top 2；代码能力超过所有开源模型，比肩标杆闭源模型 Claude 4.5 Sonnet，但推理成本仅为其 2.5%，生成速度提升 2 倍，成功将大模型推理效率推向极致。

供应商对比

共 2 家供应商提供此模型

供应商	输入价格	输出价格	上下文	吞吐量	延迟
金山云星流	0.7 元	2.1 元	262,144	64.17 t/s	-	访问 →
基石智算	2.1 元	8.4 元	262,144	-	-	访问 →