LLMRank 中文 LLM 综合参考

国际线 · 主力 vs 旗舰

Claude Sonnet 4.6 vs GPT-5.5

Claude Sonnet 4.6

国际线性价比最高的旗舰，开发者真金白银投票出来的主力

覆盖数据源 2 / 6

国际旗舰里做题强、代码强，但 AA 已被 Claude Fable 5 反超

覆盖数据源 3 / 6

TL;DR

做题 GPT-5.5 高 8.5 分，但便宜一半；写前端 Sonnet 4.6 强；用 Cursor 默认是 Sonnet 不是没原因。

关键差异

AA Intelligence：GPT-5.5 (60.24) > Sonnet 4.6 (51.71)，差 8.5 分
输出价格：GPT-5.5 $30 vs Sonnet 4.6 $15，跑量 GPT-5.5 贵一倍
LMArena WebDev：Sonnet 4.6 第 6，GPT-5.5 第 9——做题强 ≠ 写前端强
OpenRouter 用量：Sonnet 4.6 第 4 (2.05T)，GPT-5.5 没进 Top 10（OpenAI 走自家 API 不走 OpenRouter）

关键指标逐项对比

AA 数据抓取于 2026-07-11 · 价格抓取于 2026-07-11

指标	Claude Sonnet 4.6	GPT-5.5	优胜
AA 综合智能（Intelligence Index）越高越好	—	55.00	—
输入价格（$ / 百万 token）越低越好	$3.00	$5.00	A
输出价格（$ / 百万 token）越低越好	$15.00	$30.00	A
输出速度（token / 秒）越高越好	—	64	—
上下文窗口越大越好	1000K	1050K	B

价格差距：GPT-5.5 输出价比 Claude Sonnet 4.6 贵 2.00 倍（$30 vs $15）

A = Claude Sonnet 4.6，B = GPT-5.5。空缺值表示该数据源未收录此模型，不参与优胜判定。

LMArena · 人类盲测各分类

抓取于 2026-07-11

分类	Claude Sonnet 4.6	GPT-5.5
🌐 Web Dev	#2 · 1556.58	#5 · 1536.76
🔍 Search	#6 · 1219.733185426481	#2 · 1240.0951222535487
📄 Document	#6 · 1487.59	#7 · 1486.87
👁️ Vision	#16 · 1277.73	#9 · 1285.88
🏆 Overall	#26 · 1472.084642865571	#12 · 1481.0406663070514
💻 Code	#15 · 1521.1	#18 · 1501.98

只显示 Top 10 内出现的分类。同一模型不同变体（thinking / search 等）取排名最靠前的。LMArena 是人类盲测两两投票算的 Elo 分。

国内可用性 & OpenRouter 用量

Claude Sonnet 4.6

国内可用性需代理
OpenRouter 本周未进 Top 10
价格最近核验 2026-07-11

GPT-5.5

国内可用性需代理
OpenRouter 本周未进 Top 10
价格最近核验 2026-07-11

OpenRouter 用量榜抓取于 2026-07-11，反映过去 7 天聚合 API 用量。免费层模型经常冲到榜首，参考时注意是「跑量」而不是「能力」。

怎么选

选 Claude Sonnet 4.6，如果你：

日常代码助手主力（Cursor/Cline 默认）、性价比敏感、需要 LMArena WebDev 第 6 的前端能力。

选 GPT-5.5，如果你：

数学/科学推理需要顶级智能、Agent 编排、不在乎 $30/M 的输出价。

还在比的其他对

同家族升级

Claude Opus 4.7 vs Claude Sonnet 4.6

同家族 · 高速顶配 vs 主力性价比

Claude Opus 4.7 Fast vs Claude Sonnet 4.6

同家族 · 新旗舰 vs 老主力

Claude Opus 4.8 vs Claude Sonnet 4.6

Claude Fable 5 vs GPT-5.5

国际线 · 顶级对决

Claude Opus 4.7 vs GPT-5.5

国际线 · 新王 vs 旧王

Claude Opus 4.8 vs GPT-5.5

← 看所有对比回模型库 →