国际线 · 顶级 vs 长文档之王
Claude Opus 4.7 vs Gemini 3.1 Pro Preview
TL;DR
Opus 4.7 智能/写代码强,Gemini 3.1 Pro 便宜一半 + 速度快 2 倍 + 中文意外能打——百页 PDF 选 Gemini。
关键差异
- AA Intelligence:Opus 4.7 (57.28) vs Gemini 3.1 Pro (57.18),几乎打平
- 输出价格:Opus $25 vs Gemini $12,差一倍
- 输出速度:Gemini 129.5 token/s vs Opus 56.6 token/s,Gemini 快 2.3 倍
- 中文:Gemini 3.1 Pro SuperCLUE 76.69 海外榜第 2,Opus 4.7 SuperCLUE 没单独条目
关键指标逐项对比
AA 数据抓取于 2026-05-12 · 价格抓取于 2026-05-12| 指标 | Claude Opus 4.7 | Gemini 3.1 Pro Preview | 优胜 |
|---|---|---|---|
| AA 综合智能(Intelligence Index) 越高越好 | 57.28 | 57.18 | A |
| AA 代码能力(Coding Index) 越高越好 | 52.51 | 55.50 | B |
| AA Agent 能力(Agentic Index) 越高越好 | 71.29 | 59.09 | A |
| 输入价格($ / 百万 token) 越低越好 | $5.00 | $2.00 | B |
| 输出价格($ / 百万 token) 越低越好 | $25.00 | $12.00 | B |
| 输出速度(token / 秒) 越高越好 | 56.6 | 129.5 | B |
| 上下文窗口 越大越好 | 1000K | 1049K | B |
价格差距:Claude Opus 4.7 输出价比 Gemini 3.1 Pro Preview 贵 2.08 倍($25 vs $12)
A = Claude Opus 4.7,B = Gemini 3.1 Pro Preview。空缺值表示该数据源未收录此模型,不参与优胜判定。
LMArena · 人类盲测各分类
抓取于 2026-05-12| 分类 | Claude Opus 4.7 | Gemini 3.1 Pro Preview |
|---|---|---|
| 综合对话(Text) | #1 · 1503 | #4 · 1492 |
| 前端开发(WebDev) | #1 · 1570 | 未进 Top 10 |
| 视觉理解(Vision) | #1 · 1305 | #10 · 1277 |
| 联网检索(Search) | #3 · 1236 | #6 · 1217 |
只显示 Top 10 内出现的分类。同一模型不同变体(thinking / search 等)取排名最靠前的。LMArena 是人类盲测两两投票算的 Elo 分。
SuperCLUE · 中文能力测评
2026年3月| 维度 | Claude Opus 4.7 | Gemini 3.1 Pro Preview |
|---|---|---|
| 收录条目 | 未收录 | Gemini-3.1-Pro-Preview |
| 综合总分 | — | 76.69 · 榜单 #2 |
| 代码生成 | — | 69.78 |
| 数学推理 | — | 92.44 |
| 智能体(任务规划) | — | 78.96 |
| 精确指令遵循 | — | 56.76 |
Claude Opus 4.7 未收录:SuperCLUE 3 月榜里是 4.6 版本(总分 77.02,全榜第一);4.7 是 4 月新发布的 SOTA,下次榜单更新会接入。
国内可用性 & OpenRouter 用量
Claude Opus 4.7
- 国内可用性 需代理
- OpenRouter 本周 #4 · 1.33T
- 价格最近核验 2026-05-12
Gemini 3.1 Pro Preview
- 国内可用性 不稳定
- OpenRouter 本周 未进 Top 10
- 价格最近核验 2026-05-12
OpenRouter 用量榜抓取于 2026-05-12,反映过去 7 天聚合 API 用量。免费层模型经常冲到榜首,参考时注意是「跑量」而不是「能力」。
怎么选
选 Claude Opus 4.7,如果你:
复杂代码、严谨推理、LMArena Text 综合对话需要第 1 名、不计成本撑门面。
选 Gemini 3.1 Pro Preview,如果你:
长文档 RAG、百页合同/论文(1M 上下文 + $2/$12 便宜)、需要 129.5 token/s 的速度、SuperCLUE 海外榜第 2 的中文场景。