GLM-4.5-Air - AI模型价格对比 (2026/4/15)

模型信息

输入价格 0.24 - 2 元每百万tokens

输出价格 2 - 8 元每百万tokens

上下文长度 131,072 - 131,072 tokens

模态文字 → 文字

工具调用 Tools 推理

GLM-4.5 和 GLM-4.5-Air 是最新的旗舰模型系列，作为智能体应用的基础模型构建，均采用混合专家（Mixture-of-Experts）架构。GLM-4.5 总参数为 3550 亿，激活参数为 320 亿；GLM-4.5-Air 设计更加精简，总参数为 1060 亿，激活参数为 120 亿。两者的训练流程相似：首先在 15 万亿令牌的通用数据上进行预训练，其后在代码、推理、智能体等领域的数据上进行针对性训练，将上下文长度扩展至 128k，最后通过强化学习进一步增强推理、代码及智能体能力。 GLM-4.5 和 GLM-4.5-Air 针对工具调用、网页浏览、软件工程、前端编程等领域进行了优化，可集成至 Claude Code、Roo Code 等代码智能体中使用，也可通过工具调用接口支持各类智能体应用。两者均采用混合推理模式，提供两种模式：适用于复杂推理和工具使用的思考模式，以及适用于即时响应的非思考模式，可通过 thinking.type 参数进行启用或关闭（支持 enabled 和 disabled 两种设置），默认开启动态思考功能。GLM-4.5-Air 作为轻量版，在性能与性价比之间实现平衡，并支持灵活切换混合思考模型。

供应商对比

共 8 家供应商提供此模型

供应商	输入价格	输出价格	上下文	吞吐量	延迟
无问芯穹	0.6 元	4 元	131,072	81.32 t/s	-	访问 →
阿里云百炼	0.8 元	6 元	131,072	41.81 t/s	-	访问 →
智谱	0.8 元	2 元	131,072	70.56 t/s	-	访问 →
硅基流动	1 元	6 元	131,072	58.48 t/s	-	访问 →
模力方舟	1 元	6 元	131,072	62.31 t/s	-	访问 →
并行智算云	1 元	6 元	131,072	-	-	访问 →
PPIO派欧云	1.2 元	2 元	131,072	82.50 t/s	-	访问 →
七牛云	2 元	8 元	131,072	48.01 t/s	-	访问 →