🤖 AI模型价格对比

对比31家供应商的AI模型价格

共 131 个模型
bge-reranker-v2-m3
Reranker
BAAI/bge-reranker-v2-m3 是一个轻量级的多语言重排序模型。它基于 bge-m3 模型开发,具有强大的多语言能力,易于部署,并且推理速度快。...
5 个供应商
DeepSeek-OCR
视觉理解
DeepSeek-OCR 是由深度求索(DeepSeek AI)推出的一个视觉语言模型,专注于光学字符识别(OCR)与“上下文光学压缩”。该模型旨在探索从图像中...
3 个供应商
DeepSeek-OCR-2
视觉理解
DeepSeek团队开源DeepSeek-OCR 2模型,采用创新的DeepEncoder V2方法,让AI能够根据图像的含义动态重排图像的各个部分,更接近人类...
4 个供应商
DeepSeek-R1
文本生成
DeepSeek-R1-Zero 和 DeepSeek-R1 属于第一代推理模型。 DeepSeek-R1-Zero 通过大规模强化学习(RL)进行训练,未将监...
7 个供应商
DeepSeek-R1-0528
文本生成
DeepSeek R1 模型已经进行了小版本升级,当前版本为 DeepSeek-R1-0528。在最新更新中,DeepSeek R1 通过增加计算资源并引入算法...
18 个供应商
DeepSeek-R1-Distill-Llama-70B
文本生成
DeepSeek为支持研究社区,DeepSeek-R1-Zero、DeepSeek-R1 以及基于 Llama 和 Qwen 从 DeepSeek-R1 蒸馏出...
2 个供应商
DeepSeek-R1-Distill-Llama-8B
文本生成
DeepSeek为支持研究社区,DeepSeek-R1-Zero、DeepSeek-R1 以及基于 Llama 和 Qwen 从 DeepSeek-R1 蒸馏出...
1 个供应商
DeepSeek-R1-Distill-Qwen-14B
文本生成
DeepSeek为支持研究社区,DeepSeek-R1-Zero、DeepSeek-R1 以及基于 Llama 和 Qwen 从 DeepSeek-R1 蒸馏出...
4 个供应商
DeepSeek-R1-Distill-Qwen-32B
文本生成
DeepSeek为支持研究社区,DeepSeek-R1-Zero、DeepSeek-R1 以及基于 Llama 和 Qwen 从 DeepSeek-R1 蒸馏出...
9 个供应商
DeepSeek-R1-Distill-Qwen-7B
文本生成
DeepSeek为支持研究社区,DeepSeek-R1-Zero、DeepSeek-R1 以及基于 Llama 和 Qwen 从 DeepSeek-R1 蒸馏出...
5 个供应商
DeepSeek-V3
文本生成
DeepSeek-V3 是一款强大的专家混合(MoE)语言模型,总参数量为 6710 亿,每个 token 激活 37 亿个参数。为实现高效推理和具成本效益的训...
6 个供应商
DeepSeek-V3-0324
文本生成
DeepSeek-V3-0324 在核心架构和功能维度实现系统性升级,其技术突破已全面覆盖认知推理、工程实践与语言创作三大领域。在技术架构层面,通过重构推理引擎...
16 个供应商
DeepSeek-V3.1
文本生成
DeepSeek-V3.1本次升级包含以下主要变化: 混合推理架构:一个模型同时支持思考模式与非思考模式; 更高的思考效率:相比 DeepSeek-R1-052...
14 个供应商
DeepSeek-V3.1-Terminus
文本生成
此次更新在保持模型原有能力的基础上,针对用户反馈的问题进行了改进,包括: 语言一致性: 缓解了中英文混杂、偶发异常字符等情况; Agent 能力: 进一步优化了...
12 个供应商
DeepSeek-V3.2
文本生成
DeepSeek-V3.2 的目标是平衡推理能力与输出长度,适合日常使用,例如问答场景和通用 Agent 任务场景。
20 个供应商
DeepSeek-V3.2-Exp
文本生成
DeepSeek-V3.2-Exp 模型,这是一个实验性(Experimental)的版本。作为迈向新一代架构的中间步骤,V3.2-Exp 在 V3.1-Ter...
8 个供应商
Doubao-Seed-1.8
视觉理解
Doubao-Seed-1.8 面向多模态 Agent 场景定向优化。Agent 能力上,Tool Use、复杂指令遵循等能力均大幅增强。多模态理解方面,视觉基...
1 个供应商
Doubao-Seed-2.0-Code
视觉理解
面向真实编程环境优化的 Coding 模型,能稳定调用 Claude Code 等常见 IDE 中的工具。模型特别优化了前端能力,在使用常见的前端框架时能有良好...
2 个供应商
Doubao-Seed-2.0-lite
视觉理解
面向高频企业场景兼顾性能与成本的均衡型模型,综合能力超越上一代Doubao-Seed-1.8。胜任非结构化信息处理、内容创作、搜索推荐、数据分析等生产型工作,支...
2 个供应商
Doubao-Seed-2.0-mini
视觉理解
面向低时延、高并发与成本敏感场景,强调快速响应与灵活推理部署。模型效果与Doubao-Seed-1.6相当。支持256k上下文、4档思考长度和多模态理解,适合成...
2 个供应商
Doubao-Seed-2.0-pro
视觉理解
旗舰级全能通用模型,面向 Agent 时代的复杂推理与长链路任务执行场景。强调多模态理解、长上下文推理、结构化生成与工具增强执行。复杂指令与多约束执行能力突出,...
2 个供应商
Doubao-Seedance-1.0-Pro-Fast
视频生成
Seedance 1.0 pro fast是一款价格触底、效能封顶的全面模型,在视频生成质量、速度、价格之间取得了卓越平衡。它继承了Seedance 1.0 p...
1 个供应商
Doubao-Seedream-4.0
图像生成
Seedream 4.0 是基于领先架构的SOTA级多模态图像创作模型,其生成美感、指令遵循、结构完整度、主体保持一致性处于世界头部水平。模型采用同一套架构实现...
2 个供应商
Doubao-Seedream-4.5
图像生成
Seedream 4.5 是字节跳动最新推出的图像多模态模型,整合了文生图、图生图、组图输出等能力,融合常识和推理能力。相比前代4.0模型生成效果大幅提升,具备...
1 个供应商
Doubao-Seedream-5.0-lite
图像生成
Doubao-Seedream-5.0-lite是字节跳动发布的最新图像创作模型。该模型首次搭载联网检索功能,能融合实时网络信息,提升生图时效性。同时,模型的聪...
1 个供应商
ERNIE-4.5-21B-A3B
文本生成
ERNIE-4.5-21B-A3B 是 MoE 结构的对齐开源模型, 总参 21B,激活 3B。
2 个供应商
GLM-4-32B-0414
文本生成
GLM-4-32B-0414 系列是新一代开源模型,拥有 320 亿参数,性能可与 OpenAI 的 GPT 系列及 DeepSeek 的 V3/R1 系列相媲...
1 个供应商
GLM-4-9B-0414
文本生成
GLM-4-9B-0414 由于模型容量较小,未进行与 GLM-4-32B-0414 类似的智能体能力强化,优化重点放在翻译等需要大批量调用的场景,以提升此类任...
2 个供应商
GLM-4.5
文本生成
GLM-4.5 和 GLM-4.5-Air 是最新的旗舰模型系列,作为智能体应用的基础模型构建,均采用混合专家(Mixture-of-Experts)架构。GL...
8 个供应商
GLM-4.5-Air
文本生成
GLM-4.5 和 GLM-4.5-Air 是最新的旗舰模型系列,作为智能体应用的基础模型构建,均采用混合专家(Mixture-of-Experts)架构���...
8 个供应商
GLM-4.5V
视觉理解
GLM-4.5V 是智谱新一代基于 MOE 架构的视觉推理模型,以 106B 的总参数量和 12B 激活参数量,在各类基准测试中达到全球同级别开源多模态模型 S...
7 个供应商
GLM-4.6
文本生成
GLM-4.6 是智谱最新的旗舰模型,其总参数量 355B,激活参数 32B,上下文提升至 200K,8 大权威基准全面提升,稳居国产模型首位。在编程、推理、搜...
10 个供应商
GLM-4.6V
视觉理解
GLM-4.6V 是 GLM 系列在多模态方向上的一次重要迭代,它将训练时上下文窗口提升到128k tokens,在视觉理解精度上达到同参数规模 SOTA,并首...
7 个供应商
GLM-4.7
文本生成
GLM-4.7 是智谱最新旗舰模型,GLM-4.7 面向 Agentic Coding 场景强化了编码能力、长程任务规划与工具协同,并在多个公开基准的当期榜单中...
16 个供应商
GLM-4.7-Flash
文本生成
GLM-4.7-Flash 作为 30B 级 SOTA 模型,提供了一个兼顾性能与效率的新选择。面向 Agentic Coding 场景强化了编码能力、长程任务...
4 个供应商
GLM-5
文本生成
GLM-5 是面向 Coding 与 Agent 场景的新一代大模型,在复杂系统工程与长程任务中达到开源 SOTA,真实编程体验逼近 Claude Opus 级...
15 个供应商
GLM-5-Turbo
文本生成
GLM-5-Turbo 是面向 OpenClaw 龙虾场景深度优化的基座模型。 其从训练阶段就针对龙虾任务的核心需求进行专项优化,增强如工具调用、指令遵循、定时...
3 个供应商
GLM-5.1
文本生成
GLM-5.1 是智谱最新旗舰模型,代码能力大大增强,长程任务显著提升,能够在单次任务中持续、自主地工作长达 8 小时,完成从规划、执行到迭代优化的完整闭环,交...
5 个供应商
GLM-Image
图像生成
GLM-Image 是智谱新旗舰图像生成模型, 模型全程基于国产芯片完成训练,采用独创的「自回归+扩散解码器」混合架构,兼顾全局指令理解与局部细节刻画,克服了海...
1 个供应商
GLM-Z1-32B-0414
文本生成
GLM-Z1-32B-0414 是一款具备深度思考能力的推理模型,基于 GLM-4-32B-0414 通过冷启动、强化学习扩展以及在数学、代码和逻辑等任务上的进...
1 个供应商
GLM-Z1-9B-0414
文本生成
GLM-Z1-9B-0414 是一款小规模(9B 参数)的模型,延续了开源传统,基于此前系列模型的多项技术进行训练。尽管规模较小,该模型在数学推理及通用任务中依...
1 个供应商
gte-rerank
Reranker
gte-rerank-v2是通义实验室研发的多语言文本统一排序模型,面向全球多个主流语种,提供高水平的文本排序服务。通常用于语义检索、RAG等场景,可以简单、有...
1 个供应商
Hunyuan-A13B-Instruct
文本生成
Hunyuan-A13B 是一款创新且开源的大型语言模型(LLM),基于细粒度的混合专家(Mixture-of-Experts, MoE)架构构建。该模型在设计...
1 个供应商
HunyuanImage-3.0
图像生成
Hunyuan Image 3 是一款先进的文生图模型。只需提供文字描述,即可生成高质量、富有情感和故事性的图片,助力您的创意表达与艺术创作。
2 个供应商
Kimi-K2-0905
文本生成
上下文长度 256k,在 0711 版本基础上增强了 Agentic Coding 能力、前端代码美观度和实用性、以及上下文理解能力
4 个供应商
Kimi-K2-Instruct
文本生成
kimi-k2 是一款具备超强代码和 Agent 能力的 MoE 架构基础模型,总参数 1T,激活参数 32B。在通用知识推理、编程、数学、Agent 等主要类...
7 个供应商
Kimi-K2-Thinking
文本生成
K2 长思考模型,支持 256k 上下文,支持多步工具调用与思考,擅长解决更复杂的问题
11 个供应商
Kimi-K2.5
视觉理解
Kimi K2.5 是 Kimi 迄今最智能的模型,在 Agent、代码、视觉理解及一系列通用智能任务上取得开源 SoTA 表现。同时 Kimi K2.5 也是...
12 个供应商
Kling-V1
图像生成
暂无描述
1 个供应商
Kling-V1.5
图像生成
细腻真实的人像
1 个供应商
Kling-V2
图像生成
电影质感与独特美学,多元画面表现
1 个供应商
Kling-V2-New
图像生成
电影质感与独特美学,多元画面表现
1 个供应商
Kling-V2.1
图像生成
指令遵循强,文字强化,出图稳定
1 个供应商
Kling-V2.6
视频生成
音画同步生成,有声音更精彩
1 个供应商
Kling-V3
视频生成
音画同步升级,主体一致性增强,支持多镜头叙事
1 个供应商
Kling-V3-Omni
视频生成
全能多模态输入,有声角色驱动,直出音画和分镜
1 个供应商
Kling-Video-O1
视频生成
全新引擎、全新指令、全面掌控
1 个供应商
Kolors
图像生成
Kolors 是由快手 Kolors 团队开发的基于潜在扩散的大规模文本到图像生成模型。该模型通过数十亿文本-图像对的训练,在视觉质量、复杂语义准确性以及中英文...
1 个供应商
Ling-1T
文本生成
Ling-1T 是百灵混合专家(MoE)架构系列的,万亿参数量旗舰版自然语言大模型,在 20T+ 高质量语料上完成了预训练。本模型是最新发布的万亿参数级别开源模...
1 个供应商
MiMo-V2-Flash
文本生成
MiMo-V2-Flash是一个专为极致推理效率自研的总参数 309B(激活 15B)的 MoE 模型,通过 Hybrid 注意力架构创新及多层 MTP 推理加...
5 个供应商
MiniMax-Hailuo-02
视频生成
新一代视频生成模型,1080p 原生,SOTA 指令遵循,极致物理表现
1 个供应商
MiniMax-Hailuo-2.3
视频生成
MiniMax-Hailuo-2.3 是 MiniMax 于 2025 年 10 月 28 日发布的 AI 视频生成模型,基于 Hailuo 02 迭代而来,核...
1 个供应商
MiniMax-M1-80k
文本生成
MiniMax-M1 是全球首个开源的大规模混合架构推理模型。在面向生产力的复杂场景中,其能力位于开源模型的顶尖水平,超越国内闭源模型,接近海外最先进模型,同时...
4 个供应商
MiniMax-M2
文本生成
专为高效编码与Agent工作流而生
5 个供应商
MiniMax-M2.1
文本生成
强大多语言编程实力,全面升级编程体验
10 个供应商
MiniMax-M2.5
文本生成
顶尖性能与极致性价比,轻松驾驭复杂任务
17 个供应商
MiniMax-M2.7
文本生成
MiniMax M2.7 是一款全方位进化的全能型开源大语言模型,完美融合了硬核的工程生产力与高情商的拟人交互能力。在真实的软件工程场景中,M2.7 展现出卓越...
6 个供应商
MiniMax-Speech-02-hd
语音生成
MiniMax 语音大模型能够根据上下文,智能预测文本的情绪、语调等信息,并生成超自然、高保真、个性化的语音。在社交、播客、有声书、新闻资讯、教育、数字人等多种...
1 个供应商
MiniMax-Speech-2.8-hd
语音生成
MiniMax 语音大模型能够根据上下文,智能预测文本的情绪、语调等信息,并生成超自然、高保真、个性化的语音。在社交、播客、有声书、新闻资讯、教育、数字人等多种...
1 个供应商
Qwen-Image
图像生成
通义千问系列首个图像生成模型,参数规模200亿。具备卓越的文本渲染能力,在复杂文本渲染、各类生成与编辑任务重表现出色,在多个公开基准测试中获得SOTA。
5 个供应商
Qwen-Image-2.0
图像生成
Qwen-Image-2.0系列加速版模型,实现了图片生成和图片编辑的融合;具备更专业的文字渲染1k token指令支持能力、更细腻的真实质感,细腻刻画写实场景...
1 个供应商
Qwen-Image-2.0-Pro
图像生成
Qwen-Image-2.0系列满血版模型,实现了图片生成和图片编辑的融合;具备更专业的文字渲染1k token指令支持能力、更细腻的真实质感,细腻刻画写实场景...
1 个供应商
Qwen-Image-Edit
图像生成
通义千问系列首个图像编辑模型,成功将Qwen-Image的文本渲染能力拓展到编辑任务上。支持精准的中英双语文字编辑、视觉外观与语义双重编辑、具备强大的跨基准性能...
5 个供应商
Qwen-Image-Edit-Plus
图像生成
通义千问系列图像编辑Plus模型,在首版Edit模型基础上进一步优化了推理性能与系统稳定性,大幅缩短图像生成与编辑的响应时间;支持单次请求返回多张图片,显著提升...
1 个供应商
Qwen-Image-Plus
图像生成
通义千问系列图像生成模型,参数规模200亿。具备卓越��文本渲染能力,在复杂文本渲染、各类生成与编辑任务重表现出色,在多个公开基准测试中获得SOTA,模型性能大...
1 个供应商
Qwen-Max
文本生成
通义千问2.5系列千亿级别超大规模语言模型,支持中文、英文等不同语言输入。随着模型的升级,qwen-max将滚动更新升级。如果希望使用固定版本,请使用历史快照版...
1 个供应商
Qwen2.5-14B-Instruct
文本生成
Qwen2.5系列14B模型,相较于 Qwen2,Qwen2.5 获得了显著更多的知识,并在编程能力和数学能力方面有了大幅提升。此外,新模型在指令执行、生成长文...
4 个供应商
Qwen2.5-32B-Instruct
文本生成
Qwen2.5 是 Qwen 大型语言模型的最新系列,包括一系列基础语言模型和指令微调语言模型,参数量范围从 50 亿到 720 亿。与 Qwen2 相比,Qw...
5 个供应商
Qwen2.5-72B-Instruct
文本生成
Qwen2.5 是 Qwen 大型语言模型的最新系列,包括一系列基础语言模型和指令微调语言模型,参数量范围从 50 亿到 720 亿。与 Qwen2 相比,Qw...
10 个供应商
Qwen2.5-7B-Instruct
文本生成
Qwen2.5系列7B模型,相较于 Qwen2,Qwen2.5 获得了显著更多的知识,并在编程能力和数学能力方面有了大幅提升。此外,新模型在指令执行、生成长文本...
8 个供应商
Qwen2.5-Coder-32B-Instruct
文本生成
Qwen2.5系列编程专家32B模型,相较于 Qwen2,Qwen2.5 获得了显著更多的知识,并在编程能力和数学能力方面有了大幅提升。此外,新模型在指令执行、...
3 个供应商
Qwen2.5-VL-32B-Instruct
视觉理解
Qwen2.5VL系列模型,在math和学科问题解答达到了接近Qwen2.5VL-72B的水平,回复风格面向人类偏好进行大幅调整,尤其是数学、逻辑推理、知识问答...
6 个供应商
Qwen2.5-VL-72B-Instruct
视觉理解
指令跟随、数学、解题、代码整体提升,万物识别能力提升,支持多样格式直接精准定位视觉元素,支持对长视频文件(最长10分钟)进行理解和秒级别的事件时刻定位,能理解时...
8 个供应商
Qwen2.5-VL-7B-Instruct
视觉理解
指令跟随、数学、解题、代码整体提升,万物识别能力提升,支持多样格式直接精准定位视觉元素,支持对长视频文件(最长10分钟)进行理解和秒级别的事件时刻定位,能理解时...
6 个供应商
Qwen3-1.7B
文本生成
实现思考模式和非思考模式的有效融合,可在对话中切换模式。通用能力显著超过Qwen2.5小规模系列,模型人类偏好能力显著增强,创意写作、角色扮演、多轮对话、指令遵...
2 个供应商
Qwen3-14B
文本生成
实现思考模式和非思考模式的有效融合,可在对话中切换模式。推理能力达到同规模业界SOTA水平、通用能力显著超过Qwen2.5-14B。
6 个供应商
Qwen3-235B-A22B
文本生成
实现思考模式和非思考模式的有效融合,可在对话中切换模式。推理能力显著超过QwQ、通用能力显著超过Qwen2.5-72B-Instruct,达到同规模业界SOTA...
10 个供应商
Qwen3-235B-A22B-Instruct-2507
文本生成
基于Qwen3的非思考模式开源模型,相较上一版本(通义千问3-235B-A22B)主观创作能力与模型安全性均有小幅度提升。
11 个供应商
Qwen3-235B-A22B-Thinking-2507
文本生成
基于Qwen3的思考模式开源模型,相较上一版本(通义千问3-235B-A22B)逻辑能力、通用能力、知识增强及创作能力均有大幅提升,适用于高难度强推理场景。
9 个供应商
Qwen3-30B-A3B
文本生成
实现思考模式和非思考模式的有效融合,可在对话中切换模式。推理能力以更小参数规模比肩QwQ-32B、通用能力显著超过Qwen2.5-14B,达到同规模业界SOTA...
4 个供应商
Qwen3-30B-A3B-Instruct-2507
文本生成
基于Qwen3的非思考模式开源模型,相较上一版本(通义千问3-30B-A3B)中英文和多语言整体通用能力有大幅提升。主观开放类任务专项优化,显著更加符合用户偏好...
9 个供应商
Qwen3-30B-A3B-Thinking-2507
文本生成
基于Qwen3的思考模式开源模型,相较上一版本(通义千问3-30B-A3B)复杂推理类任务性能优秀,包括逻辑推理、数学、科学、代码类等具有一定难度的任务场景,指...
6 个供应商
Qwen3-32B
文本生成
Qwen3 是 Qwen 系列中最新一代的大型语言模型,提供了一套全面的密集模型和专家混合模型(MoE)。基于广泛的训练,Qwen3 在推理、指令遵循、代理能力...
12 个供应商
Qwen3-4B
文本生成
实现思考模式和非思考模式的有效融合,可在对话中切换模式。推理能力达到同规模业界SOTA水平、模型人类偏好能力显著增强,创意写作、角色扮演、多轮对话、指令遵循能力...
3 个供应商
Qwen3-8B
文本生成
实现思考模式和非思考模式的有效融合,可在对话中切换模式。推理能力达到同规模业界SOTA水平、通用能力显著超过Qwen2.5-7B。
5 个供应商
Qwen3-Coder-30B-A3B-Instruct
文本生成
基于Qwen3的代码生成模型,继承Qwen3-Coder-480B-A35B-Instruct的coding agent能力,代码能力达到同尺寸规模模型SOTA...
3 个供应商
Qwen3-Coder-480B-A35B-Instruct
文本生成
基于Qwen3的代码生成模型,具有强大的Coding Agent能力,代码能力达到开源模型 SOTA。
5 个供应商
Qwen3-Embedding-0.6B
Embedding
Qwen3-Embedding-0.6B 是 Qwen3 嵌入模型系列的最新专有模型,专为文本嵌入和排序任务设计。该模型基于 Qwen3 系列的密集基础模型,具...
5 个供应商
Qwen3-Embedding-4B
Embedding
Qwen3-Embedding-4B 是 Qwen3 嵌入模型系列的最新专有模型,专为文本嵌入和排序任务设计。该模型基于 Qwen3 系列的密集基础模型,具有 ...
3 个供应商
Qwen3-Embedding-8B
Embedding
Qwen3-Embedding-8B 是 Qwen3 嵌入模型系列的最新专有模型,专为文本嵌入和排序任务设计。该模型基于 Qwen3 系列的密集基础模型,具有 ...
5 个供应商
Qwen3-Max
文本生成
通义千问3系列Max模型,相较preview版本在智能体编程与工具调用方向进行了专项升级。本次发布的正式版模型达到领域SOTA水平,适配场景更加复杂的智能体需求...
1 个供应商
Qwen3-Max-Thinking
文本生成
通义千问3系列Max模型,相较2025年9月23日快照,此版本实现思考模式和非思考模式的有效融合,模型整体效果得到全方位的大幅度提升。在思考模式下,同时发布We...
1 个供应商
Qwen3-Next-80B-A3B-Instruct
文本生成
基于Qwen3的新一代非思考模式开源模型,相较上一版本(通义千问3-235B-A22B-Instruct-2507)中文文本理解能力更佳、逻辑推理能力有增强、文...
8 个供应商
Qwen3-Next-80B-A3B-Thinking
文本生成
基于Qwen3的新一代思考模式开源模型,相较上一版本(通义千问3-235B-A22B-Thinking-2507指令遵循能力有提升、模型总结回复更加精简。
5 个供应商
Qwen3-Reranker-0.6B
Reranker
Qwen3-Reranker-0.6B 是一款来自 Qwen3 系列的文本重排模型。 它专为优化初始检索系统的结果而设计,其核心功能是根据给定查询对文档的相关性...
3 个供应商
Qwen3-Reranker-8B
Reranker
Qwen3-Reranker-8B 是 Qwen3 系列中拥有 80 亿参数的文本重排模型。 它的设计目标是通过根据查询对文档的相关性进行精确重排,从而优化并提...
3 个供应商
Qwen3-VL-235B-A22B-Instruct
视觉理解
Qwen3系列视觉理解模型,在视觉coding、空间感知等方向全面升级;视觉感知与识别能力大幅提升,支持超长视频理解,OCR能力迎来重大升级。
8 个供应商
Qwen3-VL-235B-A22B-Thinking
视觉理解
Qwen3系列视觉理解模型,多模态思考能力显著增强,模型在STEM与数学推理方面进行了重点优化;视觉感知与识别能力全面提升、OCR能力迎来重大升级。
8 个供应商
Qwen3-VL-30B-A3B-Instruct
视觉理解
Qwen3-VL系列第二大MoE模型的Instruct版本,响应速度快,支持长视频长文档等超长上下文;全面升级图像/视频理解、空间感知与万物识别能力;具备视觉2...
5 个供应商
Qwen3-VL-30B-A3B-Thinking
视觉理解
Qwen3-VL系列第二大MoE模型的Thinking版本,响应速度快,具备更强多模态理解与推理、视觉智能体、长视���长文档等超长上下文支持能力;全面升级图像...
5 个供应商
Qwen3.5-122B-A10B
视觉理解
Qwen3.5系列122B-A10B原生视觉语言模型,基于混合架构设计,融合了线性注意力机制与稀疏混合专家模型,实现了更高的推理效率。该模型的综合表现仅次于Qw...
4 个供应商
Qwen3.5-27B
视觉理解
Qwen3.5系列27B原生视觉语言Dense模型,融合了线性注意力机制;响应速度快,兼具推理速度和性能。该模型的综合能力接近于Qwen3.5-122B-A10...
5 个供应商
Qwen3.5-35B-A3B
视觉理解
Qwen3.5系列35B-A3B原生视觉语言模型,基于混合架构设计,融合了线性注意力机制与稀疏混合专家模型,实现了更高的推理效率。该模型的综合表现接近于Qwen...
5 个供应商
Qwen3.5-397B-A17B
视觉理解
Qwen3.5系列397B-A17B原生视觉语言模型,基于混合架构设计,融合了线性注意力机制与稀疏混合专家模型,实现了更高的推理效率。在语言理解、逻辑推理、代码...
6 个供应商
Qwen3.5-4B
视觉理解
Qwen3.5-4B 是通义千问团队推出的原生多模态大语言模型,拥有 4B 参数,是 Qwen3.5 系列中最轻量的 Dense 模型。该模型采用门控 Delt...
1 个供应商
Qwen3.5-9B
视觉理解
Qwen3.5-9B 是通义千问团队推出的原生多模态大语言模型,拥有 9B 参数。作为 Qwen3.5 系列的轻量级 Dense 模型,它采用门控 Delta ...
1 个供应商
Qwen3.5-Flash
视觉理解
Qwen3.5原生视觉语言系列Flash模型,基于混合架构设计,融合了线性注意力机制与稀疏混合专家模型,实现了更高的推理效率。模型效果在纯文本与多模态方面相较3...
1 个供应商
Qwen3.5-Plus
视觉理解
Qwen3.5原生视觉语言系列Plus模型,基于混合架构设计,融合了线性注意力机制与稀疏混合专家模型,实现了更高的推理效率。在多项任务评测中,3.5系列均展现出...
3 个供应商
QwQ-32B
文本生成
基于Qwen2.5-32B模型训练的QwQ推理模型,通过强化学习大幅度提升了模型推理能力。模型数学代码等核心指标(AIME 24/25、livecodebenc...
10 个供应商
Ring-1T
文本生成
Ring-1T 是全球首个开源的万亿参数推理大模型,也是百灵混合专家(MoE)推理模型 Ring 系列中尺寸最大,推理能力最强的旗舰版模型。本模型基于 icep...
1 个供应商
Step-3.5-Flash
文本生成
阶跃星辰的旗舰语言推理模型。该模型具备顶尖推理能力与快速可靠的执行能力。能够完成对复杂任务的分解、计划,可快速可靠地调用工具执行任务,胜任逻辑推理、数学、软件工...
2 个供应商
text-embedding-v1
Embedding
通用文本向量,是通义实验室基于LLM底座的多语言文本统一向量模型,面向全球多个主流语种,提供高水准的向量服务,帮助开发者将文本数据快速转换为高质量的向量数据。
1 个供应商
Wan2.5-I2I-Preview
图像生成
通义万相2.5-文生图-Preview,全新升级模型架构。画面美学、设计感、真实质感显著提升,精准指令遵循,擅长中英文和小语种文字生成,支持复杂结构化长文本和图...
1 个供应商
Wan2.5-T2I-Preview
图像生成
通义万相2.5-图像编辑-Preview,全新升级模型架构。支持指令控制实现丰富的图像编辑能力,指令遵循能力进一步提升,支持高一致性保持的多图参考生成,文字生成...
1 个供应商
Wan2.6-I2V
视频生成
通义万相2.6-图生视频,智能分镜调度支持多镜头叙事,更高品质的声音生成,多人稳定对话,更自然真实音色,最高支持15秒时长生成
1 个供应商
Wan2.6-R2V
视频生成
通义万相2.6-参考生视频,支持指定人物或任意物品进行参考,精准保持形象和声音的一致性,支持多角色参考合拍。提醒:当使用视频进行参考时,输入视频也会计入费用,详...
1 个供应商
Wan2.6-T2V
视频生成
通义万相2.6-文生视频,智能分镜调度支持多镜头叙事,能够生成主体、场景和氛围一致的多镜头叙事视频,最高支持15秒时长,更高品质的声音生成,更好的指令遵循和视觉...
1 个供应商
即梦图片生成 4.0
图像生成
即梦4.0是即梦同源的图像生成能力,该能力在统一框架内集成了文生图、图像编辑及多图组合生成的功能:支持单次输入最多 10 张图像及进行复合编辑,并能通过对提示词...
1 个供应商
即梦文生图 3.0
图像生成
文生图3.0是即梦同源的文生图能力,在文字响应准确度、图文排版、层次美感和语义理解能力上相较之前版本均有显著提升,人像质感更逼真,且支持输出高清大图。此外,在文...
2 个供应商
即梦文生图 3.1
图像生成
文生图3.0是即梦同源的文生图能力,在文字响应准确度、图文排版、层次美感和语义理解能力上相较之前版本均有显著提升,人像质感更逼真,且支持输出高清大图。此外,在文...
2 个供应商
即梦视频生成 3.0 Pro
视频生成
即梦同源的文生视频与图生视频能力,在视频生成效果上实现飞跃,各维度均表现优异。该版本具备多镜头叙事能力,能更精准遵循指令,动态表现流畅自然,支持生成1080P高...
1 个供应商