模型信息
输入价格
0.8 - 4 元
每百万tokens
输出价格
8 - 16 元
每百万tokens
上下文长度
131,072 - 131,072
tokens
模态
文字
→ 文字
GLM-4.5 和 GLM-4.5-Air 是最新的旗舰模型系列,作为智能体应用的基础模型构建,均采用混合专家(Mixture-of-Experts)架构。GLM-4.5 总参数为 3550 亿,激活参数为 320 亿;GLM-4.5-Air 设计更加精简,总参数为 1060 亿,激活参数为 120 亿。两者的训练流程相似:首先在 15 万亿令牌的通用数据上进行预训练,其后在代码、推理、智能体等领域的数据上进行针对性训练,将上下文长度扩展至 128k,最后通过强化学习进一步增强推理、代码及智能体能力。 GLM-4.5 和 GLM-4.5-Air 针对工具调用、网页浏览、软件工程、前端编程等领域进行了优化,可集成至 Claude Code、Roo Code 等代码智能体中使用,也可通过工具调用接口支持各类智能体应用。两者均采用混合推理模式,提供两种模式:适用于复杂推理和工具使用的思考模式,以及适用于即时响应的非思考模式,可通过 thinking.type 参数进行启用或关闭(支持 enabled 和 disabled 两种设置),默认开启动态思考���能。GLM-4.5-Air 作为轻量版,在性能与性价比之间实现平衡,并支持灵活切换混合思考模型。智谱最新旗舰模型,支持思考模式切换,综合能力达到开源模型的 SOTA 水平,上下文长度可达128K。
供应商对比
共 8 家供应商提供此模型
| 供应商 | 输入价格 | 输出价格 | 上下文 | 吞吐量 | 延迟 | |
|---|---|---|---|---|---|---|
| 无问芯穹 | 2 元 | 8 元 | 131,072 | 50.40 t/s | - | 访问 → |
| 七牛云 | 2 元 | 8 元 | 131,072 | 48.90 t/s | - | 访问 → |
| UCloud | 2 元 | 8 元 | 131,072 | 45.46 t/s | - | 访问 → |
| 智谱 | 2 元 | 8 元 | 131,072 | 45.33 t/s | - | 访问 → |
| 阿里云百炼 | 3 元 | 14 元 | 131,072 | 42.31 t/s | - | 访问 → |
| 模力方舟 | 3.5 元 | 14 元 | 131,072 | 39.15 t/s | - | 访问 → |
| 并行智算云 | 3.5 元 | 14 元 | 131,072 | - | - | 访问 → |
| PPIO派欧云 | 4 元 | 16 元 | 131,072 | 45.82 t/s | - | 访问 → |