模型信息
输入价格
0.24 - 2 元
每百万tokens
输出价格
2 - 8 元
每百万tokens
上下文长度
131,072 - 131,072
tokens
模态
文字
→ 文字
GLM-4.5 和 GLM-4.5-Air 是最新的旗舰模型系列,作为智能体应用的基础模型构建,均采用混合专家(Mixture-of-Experts)架构。GLM-4.5 总参数为 3550 亿,激活参数为 320 亿;GLM-4.5-Air 设计更加精简,总参数为 1060 亿,激活参数为 120 亿。两者的训练流程相似:首先在 15 万亿令牌的通用数据上进行预训练,其后在代码、推理、智能体等领域的数据上进行针对性训练,将上下文长度扩展至 128k,最后通过强化学习进一步增强推理、代码及智能体能力。 GLM-4.5 和 GLM-4.5-Air 针对工具调用、网页浏览、软件工程、前端编程等领域进行了优化,可集成至 Claude Code、Roo Code 等代码智能体中使用,也可通过工具调用接口支持各类智能体应用。两者均采用混合推理模式,提供两种模式:适用于复杂推理和工具使用的思考模式,以及适用于即时响应的非思考模式,可通过 thinking.type 参数进行启用或关闭(支持 enabled 和 disabled 两种设置),默认开启动态思考功能。GLM-4.5-Air 作为轻量版,在性能与性价比之间实现平衡,并支持灵活切换混合思考模型。
供应商对比
共 8 家供应商提供此模型
| 供应商 | 输入价格 | 输出价格 | 上下文 | 吞吐量 | 延迟 | |
|---|---|---|---|---|---|---|
| 无问芯穹 | 0.6 元 | 4 元 | 131,072 | 81.32 t/s | - | 访问 → |
| 阿里云百炼 | 0.8 元 | 6 元 | 131,072 | 41.81 t/s | - | 访问 → |
| 智谱 | 0.8 元 | 2 元 | 131,072 | 70.56 t/s | - | 访问 → |
| 硅基流动 | 1 元 | 6 元 | 131,072 | 58.48 t/s | - | 访问 → |
| 模力方舟 | 1 元 | 6 元 | 131,072 | 62.31 t/s | - | 访问 → |
| 并行智算云 | 1 元 | 6 元 | 131,072 | - | - | 访问 → |
| PPIO派欧云 | 1.2 元 | 2 元 | 131,072 | 82.50 t/s | - | 访问 → |
| 七牛云 | 2 元 | 8 元 | 131,072 | 48.01 t/s | - | 访问 → |