Model Library

先按任务选模型，再比较价格和场景

模型页保留独立入口，但不再做名次墙。新手先看推荐组合，进阶用户再展开完整模型清单、类型筛选和价格来源。

持续评测非广告排名

模型能力和价格会持续更新

模型会按推理、编程、长文、速度、价格、上下文、国内可用性和 Agent 接入效果重新评测。价格会跟随公开信息滚动校准。

推理能力编程能力价格上下文

选完模型之后去哪里

模型只是大脑，不能停在对比表。选完以后要接工具、跑教程、做一个可验证 MVP。

先确定云端 API、本地模型、价格和上下文是否适合当前任务。

进入 2接 Agent

把模型接进 Codex、Claude Code、OpenClaw、Cline 或桌面客户端。

进入 3做安装验证

跑通一次模型回复和工具调用，确认不是只会聊天。

进入 4进入项目

回到学习路线，用模型完成一个文档、Bot、页面或自动化流程。

不知道选哪个，先从这 3 个方向开始

这里不是强行推荐唯一答案，而是让不同目标的人先少走弯路：低成本、中文长文、离线私有化。

回到学习路线

DeepSeek V4

DeepSeek V4 是模型，不是 Agent 产品。它的价值在于低成本、长上下文和兼容接口，可以作为 Claude Code、OpenCode、Cline 等 Agent/编码工具的后端模型。

DeepSeek编程Flash $0.14 输入 / $0.28 输出

Kimi K2.6

Kimi K2.6 是月之暗面当前应优先展示的开发者模型。它支持 OpenAI 兼容 API、思考开关、图片/视频输入，适合把 Claude Code、Roo Code、Cline 这类编码 Agent 接到国产模型上。

月之暗面编程按官方 Kimi API 计费

DeepSeek V4 37B

MIT开源，性价比无敌。1M上下文，单卡可跑。日常编码推荐。

DeepSeek编程免费

快速对比

只展示前几项，避免新手第一次进来就被完整清单淹没。

模型不是 Agent

TOP API

适合接入工具和 Agent

#1GPT-5.5$5 输入 / $30 输出 #2Claude Opus 4.6$5/1M #3Gemini 3.1 Pro$2 输入 / $12 输出起

TOP 本地

适合隐私、离线和低成本试验

#1DeepSeek V4 37B本地运行 #2GLM-5.1 40B本地运行 #3Qwen 3.5 17B本地运行

新手组合

一个日常模型，一个工程模型，一个本地备选

先跑通任务，再追求最强。真正要比较时，看价格、上下文、稳定性、中文体验和能不能接进你的工具链。

展开完整模型清单和筛选

类型

场景

当前显示 31 个模型

GPT-5.5

OpenAI 当前高档旗舰模型，适合复杂 Agent、专业编码、跨文档分析和高质量工作流。价格按官方 API 标准 token 口径记录，展示为输入/输出每百万 token。

OpenAI对话$5 输入 / $30 输出

DeepSeek V4 37B

MIT开源，性价比无敌。1M上下文，单卡可跑。日常编码推荐。

DeepSeek编程免费

Claude Opus 4.6

编程最强(80.8% SWE-Bench)，Agent自主任务执行领先。深度推理和代码生成首选。

Anthropic对话$5/1M

GLM-5.1 40B

自主编码最强开源，744B总参仅激活40B。单卡可跑。

智谱编程免费

Gemini 3.1 Pro

Google Gemini API 的高阶 Pro 模型，适合多模态理解和长上下文任务。价格会随标准、批处理、Flex、Priority 等档位变化。

Google对话$2 输入 / $12 输出起

Qwen 3.5 17B

397B仅激活17B。Apache 2.0，201语言。单卡流畅运行。

阿里对话免费

Claude Sonnet 4.5

平衡价格性能，日常编码Agent首选。速度比Opus快价格低60%。

Anthropic对话$2/1M

Kimi K2.6 本地/开源权重

站内把本地 Kimi 入口同步到 K2.6 口径，避免继续展示旧版本词条。实际下载和量化版本以 Ollama、ModelScope、Hugging Face 等仓库同步为准。

月之暗面编程免费

DeepSeek V4

DeepSeek V4 是模型，不是 Agent 产品。它的价值在于低成本、长上下文和兼容接口，可以作为 Claude Code、OpenCode、Cline 等 Agent/编码工具的后端模型。

DeepSeek编程Flash $0.14 输入 / $0.28 输出

MiniMax M2.5 10B

229B仅激活10B！最低配置跑最强编码。消费级显卡可用。

MiniMax编程免费

GPT-5.2

数学最强(100% AIME 2025)。适合数学和逻辑密集型任务。

OpenAI编程$1.75/1M

Gemma 4 26B

18GB内存可跑。Apache 2.0商用友好，适合消费级硬件。

Google对话免费

o3 / o4-mini

成本效益极高的推理模型。适合预算有限的复杂推理需求。

OpenAI编程$2/1M

Llama 4 Scout 17B

10M超长上下文。17B激活参数文档分析利器。

Meta对话免费

MiniMax M2.5

开源编码最强(80.2% SWE-Bench)，接近Opus水平。性价比超高。

MiniMax编程$0.30/1M

DeepSeek R1 32B

数学推理之王(97.3% MATH-500)。24GB显卡流畅运行。

DeepSeek编程免费

Kimi K2.6

Kimi K2.6 是月之暗面当前应优先展示的开发者模型。它支持 OpenAI 兼容 API、思考开关、图片/视频输入，适合把 Claude Code、Roo Code、Cline 这类编码 Agent 接到国产模型上。

月之暗面编程按官方 Kimi API 计费

Mistral Large 3 41B

Apache 2.0，675B总参仅激活41B。欧洲数据合规首选。

Mistral对话免费

GLM-5.1

国产自主编码最强(58.4% SWE-Bench Pro)。支持8小时自主编程。

智谱编程¥10/1M

#10本地模型

Qwen Coder Next

最新开源编码专用模型。46GB内存可跑，速度极快。

阿里编程免费

Qwen 3.5 397B

多语言王者(201语言)，Apache 2.0开源。多模态能力出色。

阿里对话¥4/1M

#11本地模型

SD3 Turbo

最新SD3模型，文字渲染能力显著提升。8GB显存流畅运行。

Stability AI嵌入免费

Llama 4 Maverick

最低价API模型，1M上下文。85.5% MMLU，日常任务首选。

Meta对话$0.11/1M

#12本地模型

Whisper V3 Large

最强开源语音识别，100+语言。本地转写，准确率极高。

OpenAI绘图免费

Mistral Large 3

欧洲最强Apache 2.0。多语言+数据合规，适合欧洲市场。

Mistral对话$2/1M

Command A

企业级RAG专用。内置引用和准确度优化，适合文档问答。

Cohere对话$0.15/1M

Llama 4 Scout

10M超长上下文，全球最长。单次可分析数万页文档。

Meta对话$0.11/1M

GPT Realtime / Audio

实时语音模型是近期最能降低普通人使用门槛的方向之一。它适合放进语音助手、客服问答、会议纪要和个人陪练工作流。

OpenAI绘图以官方实时语音 API 为准

Gemini / Veo 多模态视频能力

AI 视频和多模态是内容创作热门方向。它不是单个模型选择题，而是脚本、分镜、图像、视频、配音和发布检查的完整流程。

Google视频以 Google AI 官方计费为准

Qwen Coder / 通义代码模型

国产代码模型适合和 Roo Code、Cline、通义灵码、ModelScope 等工具组合，用于中文团队的代码理解和自动化开发。

阿里编程以百炼 / DashScope 官方计费为准

Embedding + Rerank 模型组合

企业 AI 落地不只靠聊天模型，Embedding 和 Rerank 决定知识库能不能找对资料。适合放进企业知识库和 Agent 试点教程。

多厂商音频按向量和重排模型官方计费

价格来源和选择说明

更新时间

2026-05-07

价格口径

公开 API 标价

来源数量

7 个来源

价格会随官方策略、地区、促销、缓存、批量折扣和中转站变化。这里用于帮助新手形成选择判断，正式接入前仍应以官方控制台为准。

OpenAI API Pricing Anthropic Pricing Google Gemini API Pricing DeepSeek API Pricing DeepSeek Coding Agents Kimi K2.6 Quickstart 阿里云 DashScope 计费文档

Next Step

模型选完以后，继续接到真实工作流

不要停在模型对比。下一步要么安装 Agent，要么回学习路线做一个小成果，再把结果放进实战复盘里。

安装 Agent 回学习路线配工具链