国内线 · 双雄对决
DeepSeek V4 Pro vs Kimi K2.6
TL;DR
Kimi K2.6 智能/Agent 高一档(AA 中国第 1),DeepSeek V4 Pro 便宜 + SuperCLUE 国内第 2——选 Kimi 看能力,选 DeepSeek 看中文 + 便宜。
关键差异
- AA Intelligence:Kimi K2.6 (53.92) > DeepSeek V4 Pro (51.51),差 2.4 分
- AA Agentic:Kimi K2.6 (65.97) vs DeepSeek V4 Pro (67.19),DeepSeek 略高
- SuperCLUE:DeepSeek V4 Pro 国内 #2 (70.98),Kimi K2.6 未收录(4 月新发)
- 输出价:DeepSeek $3.48 vs Kimi $4,DeepSeek 便宜 13%
- OpenRouter 用量:Kimi K2.6 第 2 (1.53T),DeepSeek V4 Pro 第 9 (845B)
关键指标逐项对比
AA 数据抓取于 2026-05-12 · 价格抓取于 2026-05-12| 指标 | DeepSeek V4 Pro | Kimi K2.6 | 优胜 |
|---|---|---|---|
| AA 综合智能(Intelligence Index) 越高越好 | 51.51 | 53.90 | B |
| AA 代码能力(Coding Index) 越高越好 | 47.47 | 47.12 | A |
| AA Agent 能力(Agentic Index) 越高越好 | 67.19 | 65.97 | A |
| 输入价格($ / 百万 token) 越低越好 | $0.43 | $0.74 | A |
| 输出价格($ / 百万 token) 越低越好 | $0.87 | $3.50 | A |
| 输出速度(token / 秒) 越高越好 | 30.1 | 49.3 | B |
| 上下文窗口 越大越好 | 1049K | 33K | A |
价格差距:Kimi K2.6 输出价比 DeepSeek V4 Pro 贵 4.02 倍($3.5 vs $0.87)
A = DeepSeek V4 Pro,B = Kimi K2.6。空缺值表示该数据源未收录此模型,不参与优胜判定。
LMArena · 人类盲测各分类
抓取于 2026-05-12| 分类 | DeepSeek V4 Pro | Kimi K2.6 |
|---|---|---|
| 前端开发(WebDev) | 未进 Top 10 | #7 · 1523 |
只显示 Top 10 内出现的分类。同一模型不同变体(thinking / search 等)取排名最靠前的。LMArena 是人类盲测两两投票算的 Elo 分。
SuperCLUE · 中文能力测评
2026年3月| 维度 | DeepSeek V4 Pro | Kimi K2.6 |
|---|---|---|
| 收录条目 | DeepSeek-V4-Pro | 未收录 |
| 综合总分 | 70.98 · 榜单 #5 | — |
| 代码生成 | 63.24 | — |
| 数学推理 | 87.39 | — |
| 智能体(任务规划) | 77.49 | — |
| 精确指令遵循 | 37.84 | — |
Kimi K2.6 未收录:SuperCLUE 3 月榜评的是 K2.5(Kimi-K2.5-Thinking,总分 64.6 国内榜第 7),K2.6 4 月才发布。
国内可用性 & OpenRouter 用量
DeepSeek V4 Pro
- 国内可用性 可用
- OpenRouter 本周 #9 · 845B
- 价格最近核验 2026-05-12
Kimi K2.6
- 国内可用性 可用
- OpenRouter 本周 #2 · 1.53T
- 价格最近核验 2026-05-12
OpenRouter 用量榜抓取于 2026-05-12,反映过去 7 天聚合 API 用量。免费层模型经常冲到榜首,参考时注意是「跑量」而不是「能力」。
怎么选
选 DeepSeek V4 Pro,如果你:
性价比敏感的开发场景(输出便宜 13%)、SuperCLUE 中文榜国内第 2 的中文写作、需要私有化部署(开源)。
选 Kimi K2.6,如果你:
国内代码主力(AA 中国第 1)、Agent 编排(Agentic 65.97)、OpenRouter 用量第 2 的社区生态。