🤖 AI模型价格对比

对比29家供应商的AI模型价格

共 146 个模型

bge-reranker-v2-m3

BAAI/bge-reranker-v2-m3 是一个轻量级的多语言重排序模型。它基于 bge-m3 模型开发，具有强大的多语言能力，易于部署，并且推理速度快。...

DeepSeek-OCR 是由深度求索（DeepSeek AI）推出的一个视觉语言模型，专注于光学字符识别（OCR）与“上下文光学压缩”。该模型旨在探索从图像中...

DeepSeek团队开源DeepSeek-OCR 2模型，采用创新的DeepEncoder V2方法，让AI能够根据图像的含义动态重排图像的各个部分，更接近人类...

DeepSeek-R1-Zero 和 DeepSeek-R1 属于第一代推理模型。 DeepSeek-R1-Zero 通过大规模强化学习（RL）进行训练，未将监...

DeepSeek-R1-0528

DeepSeek R1 模型已经进行了小版本升级，当前版本为 DeepSeek-R1-0528。在最新更新中，DeepSeek R1 通过增加计算资源并引入算法...

15 个供应商

DeepSeek-R1-Distill-Llama-70B

DeepSeek为支持研究社区，DeepSeek-R1-Zero、DeepSeek-R1 以及基于 Llama 和 Qwen 从 DeepSeek-R1 蒸馏出...

DeepSeek-R1-Distill-Llama-8B

DeepSeek为支持研究社区，DeepSeek-R1-Zero、DeepSeek-R1 以及基于 Llama 和 Qwen 从 DeepSeek-R1 蒸馏出...

DeepSeek-R1-Distill-Qwen-14B

DeepSeek为支持研究社区，DeepSeek-R1-Zero、DeepSeek-R1 以及基于 Llama 和 Qwen 从 DeepSeek-R1 蒸馏出...

DeepSeek-R1-Distill-Qwen-32B

DeepSeek为支持研究社区，DeepSeek-R1-Zero、DeepSeek-R1 以及基于 Llama 和 Qwen 从 DeepSeek-R1 蒸馏出...

DeepSeek-R1-Distill-Qwen-7B

DeepSeek为支持研究社区，DeepSeek-R1-Zero、DeepSeek-R1 以及基于 Llama 和 Qwen 从 DeepSeek-R1 蒸馏出...

DeepSeek-V3 是一款强大的专家混合（MoE）语言模型，总参数量为 6710 亿，每个 token 激活 37 亿个参数。为实现高效推理和具成本效益的训...

DeepSeek-V3-0324

DeepSeek-V3-0324 在核心架构和功能维度实现系统性升级，其技术突破已全面覆盖认知推理、工程实践与语言创作三大领域。在技术架构层面，通过重构推理引擎...

16 个供应商

DeepSeek-V3.1本次升级包含以下主要变化：混合推理架构：一个模型同时支持思考模式与非思考模式；更高的思考效率：相比 DeepSeek-R1-052...

13 个供应商

DeepSeek-V3.1-Terminus

此次更新在保持模型原有能力的基础上，针对用户反馈的问题进行了改进，包括：语言一致性：缓解了中英文混杂、偶发异常字符等情况； Agent 能力：进一步优化了...

11 个供应商

DeepSeek-V3.2 的目标是平衡推理能力与输出长度，适合日常使用，例如问答场景和通用 Agent 任务场景。

17 个供应商

DeepSeek-V3.2-Exp

DeepSeek-V3.2-Exp 模型，这是一个实验性（Experimental）的版本。作为迈向新一代架构的中间步骤，V3.2-Exp 在 V3.1-Ter...

DeepSeek-V4-Flash

DeepSeek V4 Flash 是 DeepSeek 开发的效率优化的专家混合模型，拥有 284B 总参数量和 13B 激活参数量，支持 1M Token的...

16 个供应商

DeepSeek-V4-Pro

DeepSeek V4 Pro 是 DeepSeek 推出的大规模混合专家模型，总参数量为 1.6T（万亿），激活参数量为 49B（十亿），支持 100 万 T...

16 个供应商

Doubao-Seed-1.8

Doubao-Seed-1.8 面向多模态 Agent 场景定向优化。Agent 能力上，Tool Use、复杂指令遵循等能力均大幅增强。多模态理解方面，视觉基...

Doubao-Seed-2.0-Code

面向真实编程环境优化的 Coding 模型，能稳定调用 Claude Code 等常见 IDE 中的工具。模型特别优化了前端能力，在使用常见的前端框架时能有良好...

Doubao-Seed-2.0-lite

面向高频企业场景兼顾性能与成本的均衡型模型，综合能力超越上一代Doubao-Seed-1.8。胜任非结构化信息处理、内容创作、搜索推荐、数据分析等生产型工作，支...

Doubao-Seed-2.0-mini

面向低时延、高并发与成本敏感场景，强调快速响应与灵活推理部署。模型效果与Doubao-Seed-1.6相当。支持256k上下文、4档思考长度和多模态理解，适合成...

Doubao-Seed-2.0-pro

旗舰级全能通用模型，面向 Agent 时代的复杂推理与长链路任务执行场景。强调多模态理解、长上下文推理、结构化生成与工具增强执行。复杂指令与多约束执行能力突出，...

Doubao-Seed-2.1-pro

面向生产级任务，全面升级编程、智能体与多模态能力。

Doubao-Seed-2.1-turbo

效果与成本均衡，全面升级编程、智能体与多模态能力。

Doubao-Seedream-4.0

Seedream 4.0 是基于领先架构的SOTA级多模态图像创作模型，其生成美感、指令遵循、结构完整度、主体保持一致性处于世界头部水平。模型采用同一套架构实现...

Doubao-Seedream-4.5

Seedream 4.5 是字节跳动最新推出的图像多模态模型，整合了文生图、图生图、组图输出等能力，融合常识和推理能力。相比前代4.0模型生成效果大幅提升，具备...

Doubao-Seedream-5.0-lite

Doubao-Seedream-5.0-lite是字节跳动发布的最新图像创作模型。该模型首次搭载联网检索功能，能融合实时网络信息，提升生图时效性。同时，模型的聪...

ERNIE-4.5-21B-A3B

ERNIE-4.5-21B-A3B 是 MoE 结构的对齐开源模型, 总参 21B，激活 3B。

GLM-4-32B-0414 系列是新一代开源模型，拥有 320 亿参数，性能可与 OpenAI 的 GPT 系列及 DeepSeek 的 V3/R1 系列相媲...

GLM-4-9B-0414 由于模型容量较小，未进行与 GLM-4-32B-0414 类似的智能体能力强化，优化重点放在翻译等需要大批量调用的场景，以提升此类任...

GLM-4.5 和 GLM-4.5-Air 是最新的旗舰模型系列，作为智能体应用的基础模型构建，均采用混合专家（Mixture-of-Experts）架构。GL...

GLM-4.5 和 GLM-4.5-Air 是最新的旗舰模型系列，作为智能体应用的基础模型构建，均采用混合专家（Mixture-of-Experts）架构。GL...

GLM-4.5V 是智谱新一代基于 MOE 架构的视觉推理模型，以 106B 的总参数量和 12B 激活参数量，在各类基准测试中达到全球同级别开源多模态模型 S...

GLM-4.6 是智谱最新的旗舰模型，其总参数量 355B，激活参数 32B，上下文提升至 200K，8 大权威基准全面提升，稳居国产模型首位。在编程、推理、搜...

GLM-4.6V 是 GLM 系列在多模态方向上的一次重要迭代，它将训练时上下文窗口提升到128k tokens，在视觉理解精度上达到同参数规模 SOTA，并首...

GLM-4.7 是智谱最新旗舰模型，GLM-4.7 面向 Agentic Coding 场景强化了编码能力、长程任务规划与工具协同，并在多个公开基准的当期榜单中...

14 个供应商

GLM-4.7-Flash 作为 30B 级 SOTA 模型，提供了一个兼顾性能与效率的新选择。面向 Agentic Coding 场景强化了编码能力、长程任务...

GLM-5 是面向 Coding 与 Agent 场景的新一代大模型，在复杂系统工程与长程任务中达到开源 SOTA，真实编程体验逼近 Claude Opus 级...

12 个供应商

GLM-5-Turbo 是面向 OpenClaw 龙虾场景深度优化的基座模型。其从训练阶段就针对龙虾任务的核心需求进行专项优化，增强如工具调用、指令遵循、定时...

GLM-5.1 是智谱最新旗舰模型，代码能力大大增强，长程任务显著提升，能够在单次任务中持续、自主地工作长达 8 小时，完成从规划、执行到迭代优化的完整闭环，交...

16 个供应商

GLM-5.2 是面向长任务时代的旗舰模型。支持真正可用的1M上下文，可承载项目级工程上下文，长程任务执行更稳定、工程规范遵循更可靠，一次任务即可完成从需求到...

GLM-Image 是智谱新旗舰图像生成模型，模型全程基于国产芯片完成训练，采用独创的「自回归+扩散解码器」混合架构，兼顾全局指令理解与局部细节刻画，克服了海...

gte-rerank-v2是通义实验室研发的多语言文本统一排序模型，面向全球多个主流语种，提供高水平的文本排序服务。通常用于语义检索、RAG等场景，可以简单、有...

Hunyuan-A13B-Instruct

Hunyuan-A13B 是一款创新且开源的大型语言模型（LLM），基于细粒度的混合专家（Mixture-of-Experts, MoE）架构构建。该模型在设计...

HunyuanImage-3.0

Hunyuan Image 3 是一款先进的文生图模型。只需提供文字描述，即可生成高质量、富有情感和故事性的图片，助力您的创意表达与艺术创作。

上下文长度 256k，在 0711 版本基础上增强了 Agentic Coding 能力、前端代码美观度��实用性、以及上下文理解能力

Kimi-K2-Instruct

kimi-k2 是一款具备超强代码和 Agent 能力的 MoE 架构基础模型，总参数 1T，激活参数 32B。在通用知识推理、编程、数学、Agent 等主要类...

Kimi-K2-Thinking

K2 长思考模型，支持 256k 上下文，支持多步工具调用与思考，擅长解决更复杂的问题

Kimi K2.5 是 Kimi 迄今最智能的模型，在 Agent、代码、视觉理解及一系列通用智能任务上取得开源 SoTA 表现。同时 Kimi K2.5 也是...

11 个供应商

Kimi K2.6 是 Kimi 最新最智能的模型，Kimi K2.6 的通用 Agent、代码、视觉理解等综合能力得到全面提升，其中在博士级难度的完整版人类最...

16 个供应商

Kimi K2.7 Code 是Kimi一款专注Coding的模型，在长上下文中更可靠地遵循指令，能以更高的成功率完成编程任务。同时支持文本、图片与视频输入，仅...

细腻真实的人像

画面稳定生动，新增多模态编辑

电影质感与独特美学，多元画面表现

电影质感与独特美学，多元画面表现

指令遵循强，文字强化，出图稳定

音画同步生成，有声音更精彩

音画同步升级，主体一致性增强，支持多镜头叙事

全能多模态输入，有声角色驱动，直出音画和分镜

全新引擎、全新指令、全面掌控

Kolors 是由快手 Kolors 团队开发的基于潜在扩散的大规模文本到图像生成模型。该模型通过数十亿文本-图像对的训练，在视觉质量、复杂语义准确性以及中英文...

Ling-1T 是百灵混合专家（MoE）架构系列的，万亿参数量旗舰版自然语言大模型，在 20T+ 高质量语料上完成了预训练。本模型是最新发布的万亿参数级别开源模...

MiMo-V2-Flash是一个专为极致推理效率自研的总参数 309B（激活 15B）的 MoE 模型，通过 Hybrid 注意力架构创新及多层 MTP 推理加...

MiniMax-Hailuo-02

新一代视频生成模型，1080p 原生，SOTA 指令遵循，极致物理表现

MiniMax-Hailuo-2.3

MiniMax-Hailuo-2.3 是 MiniMax 于 2025 年 10 月 28 日发布的 AI 视频生成模型，基于 Hailuo 02 迭代而来，核...

MiniMax-M1 是全球首个开源的大规模混合架构推理模型。在面向生产力的复杂场景中，其能力位于开源模型的顶尖水平，超越国内闭源模型，接近海外最先进模型，同时...

专为高效编码与Agent工作流而生

强大多语言编程实力，全面升级编程体验

顶尖性能与极致性价比，轻松驾驭复杂任务

16 个供应商

MiniMax M2.7 是一款全方位进化的全能型开源大语言模型，完美融合了硬核的工程生产力与高情商的拟人交互能力。在真实的软件工程场景中，M2.7 展现出卓越...

12 个供应商

原生多模态、1M 上下文的 Frontier Coding 模型

MiniMax-Speech-02-hd

MiniMax 语音大模型能够根据上下文，智能预测文本的情绪、语调等信息，并生成超自然、高保真、个性化的语音。在社交、播客、有声书、新闻资讯、教育、数字人等多种...

MiniMax-Speech-2.8-hd

MiniMax 语音大模型能够根据上下文，智能预测文本的情绪、语调等信息，并生成超自然、高保真、个性化的语音。在社交、播客、有声书、新闻资讯、教育、数字人等多种...

通义千问系列首个图像生成模型，参数规模200亿。具备卓越的文本渲染能力，在复杂文本渲染、各类生成与编辑任务重表现出色，在多个公开基准测试中获得SOTA。

Qwen-Image-2.0系列加速版模型，实现了图片生成和图片编辑的融合；具备更专业的文字渲染1k token指令支持能力、更细腻的真实质感，细腻刻画写实场景...

Qwen-Image-2.0-Pro

Qwen-Image-2.0系列满血版模型，实现了图片生成和图片编辑的融合；具备更专业的文字渲染1k token指令支持能力、更细腻的真实质感，细腻刻画写实场景...

Qwen-Image-Edit

通义千问系列首个图像编辑模型，成功将Qwen-Image的文本渲染能力拓展到编辑任务上。支持精准的中英双语文字编辑、视觉外观与语义双重编辑、具备强大的跨基准性能...

Qwen-Image-Edit-Plus

通义千问系列图像编辑Plus模型，在首版Edit模型基础上进一步优化了推理性能与系统稳定性，大幅缩短图像生成与编辑的响应时间；支持单次请求返回多张图片，显著提升...

Qwen-Image-Plus

通义千问系列图像生成模型，参数规模200亿。具备卓越的文本渲染能力，在复杂文本渲染、各类生成与编辑任务重表现出色，在多个公开基准测试中获得SOTA，模型性能大幅...

通义千问2.5系列千亿级别超大规模语言模型，支持中文、英文等不同语言输入。随着模型的升级，qwen-max将滚动更新升级。如果希望使用固定版本，请使用历史快照版...

Qwen2.5-14B-Instruct

Qwen2.5系列14B模型，相较于 Qwen2，Qwen2.5 获得了显著更多的知识，并在编程能力和数学能力方面有了大幅提升。此外，新模型在指令执行、生成长文...

Qwen2.5-32B-Instruct

Qwen2.5 是 Qwen 大型语言模型的最新系列，包括一系列基础语言模型和指令微调语言模型，参数量范围从 50 亿到 720 亿。与 Qwen2 相比，Qw...

Qwen2.5-72B-Instruct

Qwen2.5 是 Qwen 大型语言模型的最新系列，包括一系列基础语言模型和指令微调语言模型，参数量范围从 50 亿到 720 亿。与 Qwen2 相比，Qw...

Qwen2.5-7B-Instruct

Qwen2.5系列7B模型，相较于 Qwen2，Qwen2.5 获得了显著更多的知识，并在编程能力和数学能力方面有了大幅提升。此外，新模型在指令执行、生成��...

Qwen2.5-Coder-32B-Instruct

Qwen2.5系列编程专家32B模型，相较于 Qwen2，Qwen2.5 获得了显著更多的知识，并在编程能力和数学能力方面有了大幅提升。此外，新模型在指令执行、...

Qwen2.5-VL-32B-Instruct

Qwen2.5VL系列模型，在math和学科问题解答达到了接近Qwen2.5VL-72B的水平，回复风格面向人类偏好进行大幅调整，尤其是数学、逻辑推理、知识问答...

Qwen2.5-VL-72B-Instruct

指令跟随、数学、解题、代码整体提升，万物识别能力提升，支持多样格式直接精准定位视觉元素，支持对长视频文件（最长10分钟）进行理解和秒级别的事件时刻定位，能理解时...

Qwen2.5-VL-7B-Instruct

指令跟随、数学、解题、代码整体提升，万物识别能力提升，支持多样格式直接精准定位视觉元素，支持对长视频文件（最长10分钟）进行理解和秒级别的事件时刻定位，能理解时...

实现思考模式和非思考模式的有效融合，可在对话中切换模式。通用能力显著超过Qwen2.5小规模系列，模型人类偏好能力显著增强，创意写作、角色扮演、多轮对话、指令遵...

实现思考模式和非思考模式的有效融合，可在对话中切换模式。推理能力达到同规模业界SOTA水平、通用能力显著超过Qwen2.5-14B。

Qwen3-235B-A22B

实现思考模式和非思考模式的有效融合，可在对话中切换模式。推理能力显著超过QwQ、通用能力显著超过Qwen2.5-72B-Instruct，达到同规模业界SOTA...

Qwen3-235B-A22B-Instruct-2507

基于Qwen3的非思考模式开源模型，相较上一版本（通义千问3-235B-A22B）主观创作能力与模型安全性均有小幅度提升。

Qwen3-235B-A22B-Thinking-2507

基于Qwen3的思考模式开源模型，相较上一版本（通义千问3-235B-A22B）逻辑能力、通用能力、知识增强及创作能力均有大幅提升，适用于高难度强推理场景。

实现思考模式和非思考模式的有效融合，可在对话中切换模式。推理能力以更小参数规模比肩QwQ-32B、通用能力显著超过Qwen2.5-14B，达到同规模业界SOTA...

Qwen3-30B-A3B-Instruct-2507

基于Qwen3的非思考模式开源模型，相较上一版本（通义千问3-30B-A3B）中英文和多语言整体通用能力有大幅提升。主观开放类任务专项优化，显著更加符合用户偏好...

Qwen3-30B-A3B-Thinking-2507

基于Qwen3的思考模式开源模型，相较上一版本（通义千问3-30B-A3B）复杂推理类任务性能优秀，包括逻辑推理、数学、科学、代码类等具有一定难度的任务场景，指...

Qwen3 是 Qwen 系列中最新一代的大型语言模型，提供了一套全面的密集模型和专家混合模型（MoE）。基于广泛的训练，Qwen3 在推理、指令遵循、代理能力...

12 个供应商

实现思考模式和非思考模式的有效融合，可在对话中切换模式。推理能力达到同规模业界SOTA水平、模型人类偏好能力显著增强，创意写作、角色扮演、多轮对话、指令遵循能力...

实现思考模式和非思考模式的有效融合，可在对话中切换模式。推理能力达到同规模业界SOTA水平、通用能力显著超过Qwen2.5-7B。

Qwen3-Coder-30B-A3B-Instruct

基于Qwen3的代码生成模型，继承Qwen3-Coder-480B-A35B-Instruct的coding agent能力，代码能力达到同尺寸规模模型SOTA...

Qwen3-Coder-480B-A35B-Instruct

基于Qwen3的代码生成模型，具有强大的Coding Agent能力，代码能力达到开源模型 SOTA。

Qwen3-Embedding-0.6B

Qwen3-Embedding-0.6B 是 Qwen3 嵌入模型系列的最新专有模型，专为文本嵌入和排序任务设计。该模型基于 Qwen3 系列的密集基础模型，具...

Qwen3-Embedding-4B

Qwen3-Embedding-4B 是 Qwen3 嵌入模型系列的最新专有模型，专为文本嵌入和排序任务设计。该模型基于 Qwen3 系列的密集基础模型，具有 ...

Qwen3-Embedding-8B

Qwen3-Embedding-8B 是 Qwen3 嵌入模型系列的最新专有模型，专为文本嵌入和排序任务设计。该模型基于 Qwen3 系列的密集基础模型，具有 ...

通义千问3系列Max模型，相较preview版本在智能体编程与工具调用方向进行了专项升级。本次发布的正式版模型达到领域SOTA水平，适配场景更加复杂的智能体需求...

Qwen3-Max-Thinking

通义千问3系列Max模型，相较2025年9月23日快照，此版本实现思考模式和非思考模式的有效融合，模型整体效果得到全方位的大幅度提升。在思考模式下，同时发布We...

Qwen3-Next-80B-A3B-Instruct

基于Qwen3的新一代非思考模式开源模型，相较上一版本（通义千问3-235B-A22B-Instruct-2507）中文文本理解能力更佳、逻辑推理能力有增强、文...

Qwen3-Next-80B-A3B-Thinking

基于Qwen3的新一代思考模式开源模型，相较上一版本（通义千问3-235B-A22B-Thinking-2507指令遵循能力有提升、模型总结回复更加精简。

Qwen3-Reranker-0.6B

Qwen3-Reranker-0.6B 是一款来自 Qwen3 系列的文本重排模型。它专为优化初始检索系统的结果而设计，其核心功能是根据给定查询对文档的相关性...

Qwen3-Reranker-8B

Qwen3-Reranker-8B 是 Qwen3 系列中拥有 80 亿参数的文本重排模型。它的设计目标是通过根据查询对文档的相关性进行精确重排，从而优化并提...

Qwen3-VL-235B-A22B-Instruct

Qwen3系列视觉理解模型，在视觉coding、空间感知等方向全面升级；视觉感知与识别能力大幅提升，支持超长视频理解，OCR能力迎来重大升级。

Qwen3-VL-235B-A22B-Thinking

Qwen3系列视觉理解模型，多模态思考能力显著增强，模型在STEM与数学推理方面进行了重点优化；视觉感知与识别能力全面提升、OCR能力迎来重大升级。

Qwen3-VL-30B-A3B-Instruct

Qwen3-VL系列第二大MoE模型的Instruct版本，响应速度快，支持长视频长文档等超长上下文；全面升级图像/视频理解、空间感知与万物识别能力；具备视觉2...

Qwen3-VL-30B-A3B-Thinking

Qwen3-VL系列第二大MoE模型的Thinking版本，响应速度快，具备更强多模态理解与推理、视觉智能体、长视频长文档等超长上下文支持能力；全面升级图像/视...

Qwen3.5-122B-A10B

Qwen3.5系列122B-A10B原生视觉语言模型，基于混合架构设计，融合了线性注意力机制与稀疏混合专家模型，实现了更高的推理效率。该模型的综合表现仅次于Qw...

Qwen3.5系列27B原生视觉语言Dense模型，融合了线性注意力机制；响应速度快，兼具推理速度和性能。该模型的综合能力接近于Qwen3.5-122B-A10...

Qwen3.5-35B-A3B

Qwen3.5系列35B-A3B原生视觉语言模型，基于混合架构设计，融合了线性注意力机制与稀疏混合专家模型，实现了更高的推理效率。该模型的综合表现接近于Qwen...

Qwen3.5-397B-A17B

Qwen3.5系列397B-A17B原生视觉语言模型，基于混合架构设计，融合了线性注意力机制与稀疏混合专家模型，实现了更高的推理效率。在语言理解、逻辑推理、代码...

Qwen3.5-4B 是通义千问团队推出的原生多模态大语言模型，拥有 4B 参数，是 Qwen3.5 系列中最轻量的 Dense 模型。该模型采用门控 Delt...

Qwen3.5-9B 是通义千问团队推出的原生多模态大语言模型，拥有 9B 参数。作为 Qwen3.5 系列的轻量级 Dense 模型，它采用门控 Delta ...

Qwen3.5原生视觉语言系列Flash模型，基于混合架构设计，融合了线性注意力机制与稀疏混合专家模型，实现了更高的推理效率。模型效果在纯文本与多模态方面相较3...

Qwen3.5原生视觉语言系列Plus模型，基于混合架构设计，融合了线性注意力机制与稀疏混合专家模型，实现了更高的推理效率。在多项任务评测中，3.5系列均展现出...

Qwen 3.6 Plus 是 Qwen Plus 系列的下一代演进版本，采用了先进的混合架构，在效率与可扩展性上均有提升。与 3.5 系列相比，它具有更强的推...

Qwen3.7系列中规模最大、综合能力最强的Max模型，当前开放纯文本模型能力供体验。Qwen3.7是面向智能体时代的新一代旗舰模型，核心优势在于智能体能力的广...

Qwen3.7系列中高性价比Plus模型，在强大文本能力的基础上全面升级了视觉-语言能力，同时保持了在编码、工具使用和生产力工作流方面的完整智能体能力。其核心特...

基于Qwen2.5-32B模型训练的QwQ推理模型，通过强化学习大幅度提升了模型推理能力。模型数学代码等核心指标（AIME 24/25、livecodebenc...

Ring-1T 是全球首个开源的万亿参数推理大模型，也是百灵混合专家（MoE）推理模型 Ring 系列中尺寸最大，推理能力最强的旗舰版模型。本模型基于 icep...

阶跃星辰的旗舰语言推理模型。该模型具备顶尖推理能力与快速可靠的执行能力。能够完成对复杂任务的分解、计划，可快速可靠地调用工具执行任务，胜任逻辑推理、数学、软件工...

text-embedding-v1

通用文本向量，是通义实验室基于LLM底座的多语言文本统一向量模型，面向全球多个主流语种，提供高水准的向量服务，帮助开发者将文本数据快速转换为高质量的向量数据。

支持音画同出，支持智能切镜

ViduQ3-Pro-Fast

高效生成优质音视频内容，生成速度更快，性价比高

支持音画同出，支持智能切镜

Wan2.5-I2I-Preview

通义万相2.5-文生图-Preview，全新升级模型架构。画面美学、设计感、真实质感显著��升，精准指令遵循，擅长中英文和小语种文字生成，支持复杂结构化长文本...

Wan2.5-T2I-Preview

通义万相2.5-图像编辑-Preview，全新升级模型架构。支持指令控制实现丰富的图像编辑能力，指令遵循能力进一步提升，支持高一致性保持的多图参考生成，文字生成...

通义万相2.6-图生视频，智能分镜调度支持多镜头叙事，更高品质的声音生成，多人稳定对话，更自然真实音色，最高支持15秒时长生成

通义万相2.6-参考生视频，支持指定人物或任意物品进行参考，精准保持形象和声音的一致性，支持多角色参考合拍。提醒：当使用视频进行参考时，输入视频也会计入费用，详...

通义万相2.6-文生视频，智能分镜调度支持多镜头叙事，能够生成主体、场景和氛围一致的多镜头叙事视频，最高支持15秒时长，更高品质的声音生成，更好的指令遵循和视觉...

即梦图片生成 4.0

即梦4.0是即梦同源的图像生成能力，该能力在统一框架内集成了文生图、图像编辑及多图组合生成的功能：支持单次输入最多 10 张图像及进行复合编辑，并能通过对提示词...

即梦文生图 3.0

文生图3.0是即梦同源的文生图能力，在文字响应准确度、图文排版、层次美感和语义理解能力上相较之前版本均有显著提升，人像质感更逼真，且支持输出高清大图。此外，在文...

即梦文生图 3.1

文生图3.0是即梦同源的文生图能力，在文字响应准确度、图文排版、层次美感和语义理解能力上相较之前版本均有显著提升，人像质感更逼真，且支持输出高清大图。此外，在文...

即梦视频生成 3.0 Pro

即梦同源的文生视频与图生视频能力，在视频生成效果上实现飞跃，各维度均表现优异。该版本具备多镜头叙事能力，能更精准遵循指令，动态表现流畅自然，支持生成1080P高...