Model Library

先按任务选模型,再比较价格和场景

模型页保留独立入口,但不再做名次墙。新手先看推荐组合,进阶用户再展开完整模型清单、类型筛选和价格来源。

持续评测 非广告排名

模型能力和价格会持续更新

模型会按推理、编程、长文、速度、价格、上下文、国内可用性和 Agent 接入效果重新评测。价格会跟随公开信息滚动校准。

推理能力编程能力价格上下文

选完模型之后去哪里

模型只是大脑,不能停在对比表。选完以后要接工具、跑教程、做一个可验证 MVP。

不知道选哪个,先从这 3 个方向开始

这里不是强行推荐唯一答案,而是让不同目标的人先少走弯路:低成本、中文长文、离线私有化。

回到学习路线

快速对比

只展示前几项,避免新手第一次进来就被完整清单淹没。

模型不是 Agent
新手组合

一个日常模型,一个工程模型,一个本地备选

先跑通任务,再追求最强。真正要比较时,看价格、上下文、稳定性、中文体验和能不能接进你的工具链。

展开完整模型清单和筛选
类型
场景

当前显示 31 个模型

#1API 模型

GPT-5.5

OpenAI 当前高档旗舰模型,适合复杂 Agent、专业编码、跨文档分析和高质量工作流。价格按官方 API 标准 token 口径记录,展示为输入/输出每百万 token。

OpenAI对话$5 输入 / $30 输出
访问模型
#1本地模型

DeepSeek V4 37B

MIT开源,性价比无敌。1M上下文,单卡可跑。日常编码推荐。

DeepSeek编程免费
访问模型
#2API 模型

Claude Opus 4.6

编程最强(80.8% SWE-Bench),Agent自主任务执行领先。深度推理和代码生成首选。

Anthropic对话$5/1M
访问模型
#2本地模型

GLM-5.1 40B

自主编码最强开源,744B总参仅激活40B。单卡可跑。

智谱编程免费
访问模型
#3API 模型

Gemini 3.1 Pro

Google Gemini API 的高阶 Pro 模型,适合多模态理解和长上下文任务。价格会随标准、批处理、Flex、Priority 等档位变化。

Google对话$2 输入 / $12 输出起
访问模型
#3本地模型

Qwen 3.5 17B

397B仅激活17B。Apache 2.0,201语言。单卡流畅运行。

阿里对话免费
访问模型
#4API 模型

Claude Sonnet 4.5

平衡价格性能,日常编码Agent首选。速度比Opus快价格低60%。

Anthropic对话$2/1M
访问模型
#4本地模型

Kimi K2.6 本地/开源权重

站内把本地 Kimi 入口同步到 K2.6 口径,避免继续展示旧版本词条。实际下载和量化版本以 Ollama、ModelScope、Hugging Face 等仓库同步为准。

月之暗面编程免费
访问模型
#5API 模型

DeepSeek V4

DeepSeek V4 是模型,不是 Agent 产品。它的价值在于低成本、长上下文和兼容接口,可以作为 Claude Code、OpenCode、Cline 等 Agent/编码工具的后端模型。

DeepSeek编程Flash $0.14 输入 / $0.28 输出
访问模型
#5本地模型

MiniMax M2.5 10B

229B仅激活10B!最低配置跑最强编码。消费级显卡可用。

MiniMax编程免费
访问模型
#6API 模型

GPT-5.2

数学最强(100% AIME 2025)。适合数学和逻辑密集型任务。

OpenAI编程$1.75/1M
访问模型
#6本地模型

Gemma 4 26B

18GB内存可跑。Apache 2.0商用友好,适合消费级硬件。

Google对话免费
访问模型
#7API 模型

o3 / o4-mini

成本效益极高的推理模型。适合预算有限的复杂推理需求。

OpenAI编程$2/1M
访问模型
#7本地模型

Llama 4 Scout 17B

10M超长上下文。17B激活参数文档分析利器。

Meta对话免费
访问模型
#8API 模型

MiniMax M2.5

开源编码最强(80.2% SWE-Bench),接近Opus水平。性价比超高。

MiniMax编程$0.30/1M
访问模型
#8本地模型

DeepSeek R1 32B

数学推理之王(97.3% MATH-500)。24GB显卡流畅运行。

DeepSeek编程免费
访问模型
#9API 模型

Kimi K2.6

Kimi K2.6 是月之暗面当前应优先展示的开发者模型。它支持 OpenAI 兼容 API、思考开关、图片/视频输入,适合把 Claude Code、Roo Code、Cline 这类编码 Agent 接到国产模型上。

月之暗面编程按官方 Kimi API 计费
访问模型
#9本地模型

Mistral Large 3 41B

Apache 2.0,675B总参仅激活41B。欧洲数据合规首选。

Mistral对话免费
访问模型
#10API 模型

GLM-5.1

国产自主编码最强(58.4% SWE-Bench Pro)。支持8小时自主编程。

智谱编程¥10/1M
访问模型
#10本地模型

Qwen Coder Next

最新开源编码专用模型。46GB内存可跑,速度极快。

阿里编程免费
访问模型
#11API 模型

Qwen 3.5 397B

多语言王者(201语言),Apache 2.0开源。多模态能力出色。

阿里对话¥4/1M
访问模型
#11本地模型

SD3 Turbo

最新SD3模型,文字渲染能力显著提升。8GB显存流畅运行。

Stability AI嵌入免费
访问模型
#12API 模型

Llama 4 Maverick

最低价API模型,1M上下文。85.5% MMLU,日常任务首选。

Meta对话$0.11/1M
访问模型
#12本地模型

Whisper V3 Large

最强开源语音识别,100+语言。本地转写,准确率极高。

OpenAI绘图免费
访问模型
#13API 模型

Mistral Large 3

欧洲最强Apache 2.0。多语言+数据合规,适合欧洲市场。

Mistral对话$2/1M
访问模型
#14API 模型

Command A

企业级RAG专用。内置引用和准确度优化,适合文档问答。

Cohere对话$0.15/1M
访问模型
#15API 模型

Llama 4 Scout

10M超长上下文,全球最长。单次可分析数万页文档。

Meta对话$0.11/1M
访问模型
#16API 模型

GPT Realtime / Audio

实时语音模型是近期最能降低普通人使用门槛的方向之一。它适合放进语音助手、客服问答、会议纪要和个人陪练工作流。

OpenAI绘图以官方实时语音 API 为准
访问模型
#17API 模型

Gemini / Veo 多模态视频能力

AI 视频和多模态是内容创作热门方向。它不是单个模型选择题,而是脚本、分镜、图像、视频、配音和发布检查的完整流程。

Google视频以 Google AI 官方计费为准
访问模型
#18API 模型

Qwen Coder / 通义代码模型

国产代码模型适合和 Roo Code、Cline、通义灵码、ModelScope 等工具组合,用于中文团队的代码理解和自动化开发。

阿里编程以百炼 / DashScope 官方计费为准
访问模型
#19API 模型

Embedding + Rerank 模型组合

企业 AI 落地不只靠聊天模型,Embedding 和 Rerank 决定知识库能不能找对资料。适合放进企业知识库和 Agent 试点教程。

多厂商音频按向量和重排模型官方计费
访问模型
价格来源和选择说明
更新时间

2026-05-07

价格口径

公开 API 标价

来源数量

7 个来源

价格会随官方策略、地区、促销、缓存、批量折扣和中转站变化。这里用于帮助新手形成选择判断,正式接入前仍应以官方控制台为准。

Next Step

模型选完以后,继续接到真实工作流

不要停在模型对比。下一步要么安装 Agent,要么回学习路线做一个小成果,再把结果放进实战复盘里。