Claude Sonnet 4.6
Anthropic国际线性价比最高的旗舰,开发者真金白银投票出来的主力
发布日期:2026-02-17 · 覆盖数据源:4 / 5 (AA · Arena · Pricing · OpenRouter)
Anthropic 中端旗舰。OpenRouter 周用量榜第 3(1.49T tokens),仅次于腾讯 Hy3 Preview 免费版和 Kimi K2.6。AA Intelligence 51.7、Coding Index 50.9——做题成绩不算顶尖,但 LMArena WebDev 拿到第 6 名(1524 分),写前端代码体感比做题分数好得多。$3/M 输入、$15/M 输出,比 Opus 4.7 便宜 40%,是大多数 Claude 用户的实际选择。
关键指标
AA Intelligence
51.7
全球 #9
AA Coding
50.9
Coding #6
AA Agentic
63.0
Tool/Agent 能力
输出价格
$15.00
/ 百万 token
Artificial Analysis · 独立评测
artificialanalysis.ai · 抓取于 2026-05-12| 综合智能(Intelligence Index) | 51.72 |
| 代码能力(Coding Index) | 50.94 |
| Agent 能力(Agentic Index) | 63.00 |
| 输出速度 | 51 token/s |
| 推理模式 | 是(reasoning model) |
AA 是独立第三方评测站,综合 GPQA / HLE / MMLU-Pro / SciCode / Tau²-Bench / TerminalBench / IFBench 等公开基准。 同一模型不同 reasoning effort 配置 AA 拆开排,本表只取最高分那档。
LMArena · 人类盲测排名
lmarena.ai · 抓取于 2026-05-12| 分类 | 最佳变体 | 排名 | Elo |
|---|---|---|---|
| 联网检索(Search) | claude-sonnet-4-6-search | #5 | 1221 |
| 前端开发(WebDev) | claude-sonnet-4-6 | #6 | 1524 |
只展示 Top 10 内出现的分类与变体。同一分类下若有多个变体(thinking / search 等),只显示排名最靠前的。 LMArena 是 Elo 分,人类盲测两两投票算出来—— 「人类觉得好」≠「客观最强」,但反映真实使用体验。
SuperCLUE · 中文能力测评
未收录:SuperCLUE 3 月榜里没有 Sonnet 4.6 单独条目(只评了 Opus 4.6)。
API 价格与国内可用性
来源 openrouter.ai · 抓取于 2026-05-12| 输入价格 | $3.00 / 百万 token |
| 输出价格 | $15.00 / 百万 token |
| 上下文窗口 | 1000K tokens |
| 国内可用性 | 需代理 |
| 最近核验 | 2026-05-12 |
同档对手价格
| 模型 | 输入 | 输出 | 国内 |
|---|---|---|---|
| GPT-5.4 · OpenAI | $2.50 | $15.00 | 需代理 |
| Gemini 3.1 Pro Preview · Google | $2.00 | $12.00 | 不稳定 |
| Qwen3.6 Max Preview · Alibaba (阿里云百炼) | $1.04 | $6.24 | 可用 |
| Claude Opus 4.7 · Anthropic | $5.00 | $25.00 | 需代理 |
OpenRouter 周用量
来源 openrouter.ai/rankings · 抓取于 2026-05-12本周排名
#3
7 天 token 量
1.49T
环比变化
↑ 12%
OpenRouter 聚合多家模型 API,能跨厂商看真实开发用量。 用量排名偏向便宜+免费层——免费版常能冲到榜首,并不代表能力。
什么时候选它 / 别选它
适合场景
- 日常代码助手主力——Cursor/Cline/Claude Code 默认推这款不是没原因
- 长上下文工作流(1M)+ tool use 频繁的 agent
- 性价比敏感但要稳定旗舰水准的团队
不适合场景
- 极致便宜跑量——$15/M 输出比国内同档贵 3-5 倍
- 完全离不开中文场景且无法走代理的——AA 没特意测中文,SuperCLUE 也没收