国际线 · 主力 vs 旗舰

Claude Sonnet 4.6 vs GPT-5.5

TL;DR

做题 GPT-5.5 高 8.5 分,但便宜一半;写前端 Sonnet 4.6 强;用 Cursor 默认是 Sonnet 不是没原因。

关键差异

  • AA Intelligence:GPT-5.5 (60.24) > Sonnet 4.6 (51.71),差 8.5 分
  • 输出价格:GPT-5.5 $30 vs Sonnet 4.6 $15,跑量 GPT-5.5 贵一倍
  • LMArena WebDev:Sonnet 4.6 第 6,GPT-5.5 第 9——做题强 ≠ 写前端强
  • OpenRouter 用量:Sonnet 4.6 第 3 (1.49T),GPT-5.5 没进 Top 10(OpenAI 走自家 API 不走 OpenRouter)

关键指标逐项对比

AA 数据抓取于 2026-05-12 · 价格抓取于 2026-05-12
指标 Claude Sonnet 4.6 GPT-5.5 优胜
AA 综合智能(Intelligence Index) 越高越好 51.72 60.24 B
AA 代码能力(Coding Index) 越高越好 50.94 59.12 B
AA Agent 能力(Agentic Index) 越高越好 63.00 74.12 B
输入价格($ / 百万 token) 越低越好 $3.00 $5.00 A
输出价格($ / 百万 token) 越低越好 $15.00 $30.00 A
输出速度(token / 秒) 越高越好 51 61.7 B
上下文窗口 越大越好 1000K 1050K B

价格差距:GPT-5.5 输出价比 Claude Sonnet 4.6 贵 2.00 倍($30 vs $15)

A = Claude Sonnet 4.6,B = GPT-5.5。空缺值表示该数据源未收录此模型,不参与优胜判定。

LMArena · 人类盲测各分类

抓取于 2026-05-12
分类 Claude Sonnet 4.6 GPT-5.5
联网检索(Search) #5 · 1221 #2 · 1242
前端开发(WebDev) #6 · 1524 #9 · 1491
视觉理解(Vision) 未进 Top 10 #7 · 1288
综合对话(Text) 未进 Top 10 #8 · 1484

只显示 Top 10 内出现的分类。同一模型不同变体(thinking / search 等)取排名最靠前的。LMArena 是人类盲测两两投票算的 Elo 分。

国内可用性 & OpenRouter 用量

Claude Sonnet 4.6
  • 国内可用性 需代理
  • OpenRouter 本周 #3 · 1.49T
  • 价格最近核验 2026-05-12
GPT-5.5
  • 国内可用性 需代理
  • OpenRouter 本周 未进 Top 10
  • 价格最近核验 2026-05-12

OpenRouter 用量榜抓取于 2026-05-12,反映过去 7 天聚合 API 用量。免费层模型经常冲到榜首,参考时注意是「跑量」而不是「能力」。

怎么选

Claude Sonnet 4.6,如果你:

日常代码助手主力(Cursor/Cline 默认)、性价比敏感、需要 LMArena WebDev 第 6 的前端能力。

GPT-5.5,如果你:

数学/科学推理需要顶级智能、Agent 编排(Agentic 74.12 最高)、不在乎 $30/M 的输出价。

还在比的其他对