GLM-4.5-Air

文本生成

模型信息

输入价格 0.24 - 2 元 每百万tokens
输出价格 2 - 8 元 每百万tokens
上下文长度 131,072 - 131,072 tokens
模态 文字 → 文字
工具调用 Tools 推理

GLM-4.5 和 GLM-4.5-Air 是最新的旗舰模型系列,作为智能体应用的基础模型构建,均采用混合专家(Mixture-of-Experts)架构。GLM-4.5 总参数为 3550 亿,激活参数为 320 亿;GLM-4.5-Air 设计更加精简,总参数为 1060 亿,激活参数为 120 亿。两者的训练流程相似:首先在 15 万亿令牌的通用数据上进行预训练,其后在代码、推理、智能体等领域的数据上进行针对性训练,将上下文长度扩展至 128k,最后通过强化学习进一步增强推理、代码及智能体能力。 GLM-4.5 和 GLM-4.5-Air 针对工具调用、网页浏览、软件工程、前端编程等领域进行了优化,可集成至 Claude Code、Roo Code 等代码智能体中使用,也可通过工具调用接口支持各类智能体应用。两者均采用混合推理模式,提供两种模式:适用于复杂推理和工具使用的思考模式,以及适用于即时响应的非思考模式,可通过 thinking.type 参数进行启用或关闭(支持 enabled 和 disabled 两种设置),默认开启动态思考功能。GLM-4.5-Air 作为轻量版,在性能与性价比之间实现平衡,并支持灵活切换混合思考模型。

供应商对比

供应商 输入价格 输出价格 上下文 吞吐量 延迟
无问芯穹 0.6 元 4 元 131,072 81.32 t/s - 访问 →
阿里云百炼 0.8 元 6 元 131,072 41.81 t/s - 访问 →
智谱 0.8 元 2 元 131,072 70.56 t/s - 访问 →
硅基流动 1 元 6 元 131,072 58.48 t/s - 访问 →
模力方舟 1 元 6 元 131,072 62.31 t/s - 访问 →
并行智算云 1 元 6 元 131,072 - - 访问 →
PPIO派欧云 1.2 元 2 元 131,072 82.50 t/s - 访问 →
七牛云 2 元 8 元 131,072 48.01 t/s - 访问 →