GLM-4.5 - AI模型价格对比 (2026/4/15)

模型信息

输入价格 0.8 - 4 元每百万tokens

输出价格 8 - 16 元每百万tokens

上下文长度 131,072 - 131,072 tokens

模态文字 → 文字

工具调用 Tools 推理

GLM-4.5 和 GLM-4.5-Air 是最新的旗舰模型系列，作为智能体应用的基础模型构建，均采用混合专家（Mixture-of-Experts）架构。GLM-4.5 总参数为 3550 亿，激活参数为 320 亿；GLM-4.5-Air 设计更加精简，总参数为 1060 亿，激活参数为 120 亿。两者的训练流程相似：首先在 15 万亿令牌的通用数据上进行预训练，其后在代码、推理、智能体等领域的数据上进行针对性训练，将上下文长度扩展至 128k，最后通过强化学习进一步增强推理、代码及智能体能力。 GLM-4.5 和 GLM-4.5-Air 针对工具调用、网页浏览、软件工程、前端编程等领域进行了优化，可集成至 Claude Code、Roo Code 等代码智能体中使用，也可通过工具调用接口支持各类智能体应用。两者均采用混合推理模式，提供两种模式：适用于复杂推理和工具使用的思考模式，以及适用于即时响应的非思考模式，可通过 thinking.type 参数进行启用或关闭（支持 enabled 和 disabled 两种设置），默认开启动态思考��能。GLM-4.5-Air 作为轻量版，在性能与性价比之间实现平衡，并支持灵活切换混合思考模型。智谱最新旗舰模型，支持思考模式切换，综合能力达到开源模型的 SOTA 水平，上下文长度可达128K。

供应商对比

共 8 家供应商提供此模型

供应商	输入价格	输出价格	上下文	吞吐量	延迟
无问芯穹	2 元	8 元	131,072	50.40 t/s	-	访问 →
七牛云	2 元	8 元	131,072	48.90 t/s	-	访问 →
UCloud	2 元	8 元	131,072	45.46 t/s	-	访问 →
智谱	2 元	8 元	131,072	45.33 t/s	-	访问 →
阿里云百炼	3 元	14 元	131,072	42.31 t/s	-	访问 →
模力方舟	3.5 元	14 元	131,072	39.15 t/s	-	访问 →
并行智算云	3.5 元	14 元	131,072	-	-	访问 →
PPIO派欧云	4 元	16 元	131,072	45.82 t/s	-	访问 →