Model Rankings
API 云模型 + 本地部署模型 · 排名和推荐
新手推荐组合
日常:DeepSeek V3(便宜)
编程:Qwen Coder(快)
本地:Qwen3 32B(均衡)
27 models
2026旗舰,幻觉减少33%。综合能力最强,复杂Agent和多步推理任务首选。
MIT开源,性价比无敌。1M上下文,单卡可跑。日常编码推荐。
编程最强(80.8% SWE-Bench),Agent自主任务执行领先。深度推理和代码生成首选。
自主编码最强开源,744B总参仅激活40B。单卡可跑。
多模态之王(ARC-AGI-2 77.1%)。原生图文音视频理解,性价比高。
397B仅激活17B。Apache 2.0,201语言。单卡流畅运行。
平衡价格性能,日常编码Agent首选。速度比Opus快价格低60%。
1T参数32B激活。视觉编码和多模态理解强。
数学最强(100% AIME 2025)。适合数学和逻辑密集型任务。
229B仅激活10B!最低配置跑最强编码。消费级显卡可用。
成本效益极高的推理模型。适合预算有限的复杂推理需求。
18GB内存可跑。Apache 2.0商用友好,适合消费级硬件。
性价比之王!MIT开源,1M上下文,价格仅为GPT的1/12。
10M超长上下文。17B激活参数文档分析利器。
开源编码最强(80.2% SWE-Bench),接近Opus水平。性价比超高。
数学推理之王(97.3% MATH-500)。24GB显卡流畅运行。
国产自主编码最强(58.4% SWE-Bench Pro)。支持8小时自主编程。
Apache 2.0,675B总参仅激活41B。欧洲数据合规首选。
视觉编码领先(LiveCodeBench 85%)。1T参数32B激活,中文顶级。
最新开源编码专用模型。46GB内存可跑,速度极快。
多语言王者(201语言),Apache 2.0开源。多模态能力出色。
最新SD3模型,文字渲染能力显著提升。8GB显存流畅运行。
最低价API模型,1M上下文。85.5% MMLU,日常任务首选。
最强开源语音识别,100+语言。本地转写,准确率极高。
欧洲最强Apache 2.0。多语言+数据合规,适合欧洲市场。
企业级RAG专用。内置引用和准确度优化,适合文档问答。
10M超长上下文,全球最长。单次可分析数万页文档。