跨境 · 国际主力 vs 国内旗舰

Claude Sonnet 4.6 vs DeepSeek V4 Pro

TL;DR

Claude Sonnet 4.6 国际线主力(OpenRouter 用量 #3),DeepSeek V4 Pro 国内 #2 + 便宜 4 倍 + 不用代理——预算紧 + 国内场景直接选 DeepSeek。

关键差异

  • AA Intelligence:Sonnet 4.6 (51.71) vs DeepSeek V4 Pro (51.51),几乎打平
  • 输出价:Sonnet $15 vs DeepSeek $3.48,Sonnet 贵 4.3 倍
  • LMArena WebDev:Sonnet 4.6 第 6,V4 Pro 没进 Top 10
  • 国内可用性:Sonnet 4.6 需代理,V4 Pro 直连大陆

关键指标逐项对比

AA 数据抓取于 2026-05-12 · 价格抓取于 2026-05-12
指标 Claude Sonnet 4.6 DeepSeek V4 Pro 优胜
AA 综合智能(Intelligence Index) 越高越好 51.72 51.51 A
AA 代码能力(Coding Index) 越高越好 50.94 47.47 A
AA Agent 能力(Agentic Index) 越高越好 63.00 67.19 B
输入价格($ / 百万 token) 越低越好 $3.00 $0.43 B
输出价格($ / 百万 token) 越低越好 $15.00 $0.87 B
输出速度(token / 秒) 越高越好 51 30.1 A
上下文窗口 越大越好 1000K 1049K B

价格差距:Claude Sonnet 4.6 输出价比 DeepSeek V4 Pro 贵 17.24 倍($15 vs $0.87)

A = Claude Sonnet 4.6,B = DeepSeek V4 Pro。空缺值表示该数据源未收录此模型,不参与优胜判定。

LMArena · 人类盲测各分类

抓取于 2026-05-12
分类 Claude Sonnet 4.6 DeepSeek V4 Pro
联网检索(Search) #5 · 1221 未进 Top 10
前端开发(WebDev) #6 · 1524 未进 Top 10

只显示 Top 10 内出现的分类。同一模型不同变体(thinking / search 等)取排名最靠前的。LMArena 是人类盲测两两投票算的 Elo 分。

SuperCLUE · 中文能力测评

2026年3月
维度 Claude Sonnet 4.6 DeepSeek V4 Pro
收录条目 未收录 DeepSeek-V4-Pro
综合总分 70.98 · 榜单 #5
代码生成 63.24
数学推理 87.39
智能体(任务规划) 77.49
精确指令遵循 37.84

Claude Sonnet 4.6 未收录:SuperCLUE 3 月榜里没有 Sonnet 4.6 单独条目(只评了 Opus 4.6)。

国内可用性 & OpenRouter 用量

Claude Sonnet 4.6
  • 国内可用性 需代理
  • OpenRouter 本周 #3 · 1.49T
  • 价格最近核验 2026-05-12
DeepSeek V4 Pro
  • 国内可用性 可用
  • OpenRouter 本周 #9 · 845B
  • 价格最近核验 2026-05-12

OpenRouter 用量榜抓取于 2026-05-12,反映过去 7 天聚合 API 用量。免费层模型经常冲到榜首,参考时注意是「跑量」而不是「能力」。

怎么选

Claude Sonnet 4.6,如果你:

海外业务 + 需要 LMArena WebDev 第 6 的前端能力、Cursor/Cline 默认主力、已经在用 Claude 生态。

DeepSeek V4 Pro,如果你:

国内部署不走代理(DeepSeek 大陆节点稳定)、性价比(输出价便宜 4.3 倍)、中文场景(SuperCLUE 国内 #2)。

还在比的其他对