LLMRank 中文 LLM 综合参考

跨境 · 国际旗舰 vs 国内 #1

GPT-5.5 vs Kimi K2.6

国际旗舰里做题强、代码强，但 AA 已被 Claude Fable 5 反超

覆盖数据源 3 / 6

Moonshot AI · 🇨🇳

国内代码/Agent 主力，AA 中国第 5 + SuperCLUE 智能体维度国内前三

覆盖数据源 3 / 6

TL;DR

做题分 GPT-5.5 完胜（差 6 分），但 Kimi K2.6 便宜 7.5 倍 + 国内直连——做题选 GPT，跑量国内场景选 Kimi。

关键差异

AA Intelligence：GPT-5.5 (60.24) > Kimi K2.6 (53.92)，差 6.3 分
输出价：GPT-5.5 $30 vs Kimi $3.49，GPT 贵 8.6 倍
国内可用性：GPT-5.5 需代理，Kimi 直连国内

关键指标逐项对比

AA 数据抓取于 2026-07-11 · 价格抓取于 2026-07-11

指标	GPT-5.5	Kimi K2.6	优胜
AA 综合智能（Intelligence Index）越高越好	55.00	44.00	A
输入价格（$ / 百万 token）越低越好	$5.00	$0.66	B
输出价格（$ / 百万 token）越低越好	$30.00	$3.41	B
输出速度（token / 秒）越高越好	64	42	A
上下文窗口越大越好	1050K	262K	A

价格差距：GPT-5.5 输出价比 Kimi K2.6 贵 8.80 倍（$30 vs $3.41）

A = GPT-5.5，B = Kimi K2.6。空缺值表示该数据源未收录此模型，不参与优胜判定。

LMArena · 人类盲测各分类

抓取于 2026-07-11

分类	GPT-5.5	Kimi K2.6
🔍 Search	#2 · 1240.0951222535487	未进 Top 10
🌐 Web Dev	#5 · 1536.76	#7 · 1522.3
📄 Document	#7 · 1486.87	#15 · 1453.63
👁️ Vision	#9 · 1285.88	#20 · 1265.59
🏆 Overall	#12 · 1481.0406663070514	#37 · 1461.7406897779504
💻 Code	#18 · 1501.98	#17 · 1513.26

只显示 Top 10 内出现的分类。同一模型不同变体（thinking / search 等）取排名最靠前的。LMArena 是人类盲测两两投票算的 Elo 分。

国内可用性 & OpenRouter 用量

GPT-5.5

国内可用性需代理
OpenRouter 本周未进 Top 10
价格最近核验 2026-07-11

Kimi K2.6

国内可用性可用
OpenRouter 本周未进 Top 10
价格最近核验 2026-07-11

OpenRouter 用量榜抓取于 2026-07-11，反映过去 7 天聚合 API 用量。免费层模型经常冲到榜首，参考时注意是「跑量」而不是「能力」。

怎么选

选 GPT-5.5，如果你：

数学/科学推理顶级、复杂算法、Agent 编排。

选 Kimi K2.6，如果你：

国内开发不走代理、性价比（输出便宜 7.5 倍）、AA 中国榜第 1 的中文场景。

还在比的其他对

Claude Fable 5 vs GPT-5.5

国际线 · 顶级对决

Claude Opus 4.7 vs GPT-5.5

国际线 · 新王 vs 旧王

Claude Opus 4.8 vs GPT-5.5

跨境 · 国际顶级 vs 国内 AA #1

Claude Opus 4.7 vs Kimi K2.6

跨境 · 国际主力 vs 国内旗舰

Claude Sonnet 4.6 vs Kimi K2.6

国内线 · 双雄对决

DeepSeek V4 Pro vs Kimi K2.6

← 看所有对比回模型库 →