Gemini 3.1 Pro Preview

Google

百万上下文加便宜价格,长文档场景的国际线首选

发布日期:2026-02-19 · 覆盖数据源:4 / 5 (AA · Arena · SuperCLUE · Pricing)

Google 当前主力 Pro 档。AA Intelligence 57.18 全球第 3(仅次于 GPT-5.5 和 Claude Opus 4.7),但价格 $2/M 输入 + $12/M 输出,是 Top 3 里最便宜的。SuperCLUE 中文榜以 76.69 排海外第 2、整体第 2,中文能力意外能打。1M 上下文塞百页 PDF 不眨眼,输出速度 129.5 token/s 远超 Claude 的 56.6。

关键指标

AA Intelligence
57.2
全球 #3
AA Coding
55.5
Coding #2
AA Agentic
59.1
Tool/Agent 能力
输出价格
$12.00
/ 百万 token

Artificial Analysis · 独立评测

artificialanalysis.ai · 抓取于 2026-05-12
综合智能(Intelligence Index) 57.18
代码能力(Coding Index) 55.50
Agent 能力(Agentic Index) 59.09
输出速度 129.5 token/s
推理模式 是(reasoning model)

AA 是独立第三方评测站,综合 GPQA / HLE / MMLU-Pro / SciCode / Tau²-Bench / TerminalBench / IFBench 等公开基准。 同一模型不同 reasoning effort 配置 AA 拆开排,本表只取最高分那档。

LMArena · 人类盲测排名

lmarena.ai · 抓取于 2026-05-12
分类 最佳变体 排名 Elo
综合对话(Text) gemini-3.1-pro-preview #4 1492
联网检索(Search) gemini-3.1-pro-grounding #6 1217
视觉理解(Vision) gemini-3.1-pro-preview #10 1277

只展示 Top 10 内出现的分类与变体。同一分类下若有多个变体(thinking / search 等),只显示排名最靠前的。 LMArena 是 Elo 分,人类盲测两两投票算出来—— 「人类觉得好」≠「客观最强」,但反映真实使用体验。

SuperCLUE · 中文能力测评

superclueai.com · 2026年3月
收录条目 Gemini-3.1-Pro-Preview
综合总分 76.69 (榜单第 2 位)
代码生成 69.78
数学推理 92.44
智能体(任务规划) 78.96
精确指令遵循 56.76

SuperCLUE 是国内做中文测评最久的独立基准。覆盖数学/科学/幻觉/指令/代码/Agent 六维。 官方说明:分差 1 分内并列,部分模型只做参考不参与排名。

API 价格与国内可用性

来源 openrouter.ai · 抓取于 2026-05-12
输入价格 $2.00 / 百万 token
输出价格 $12.00 / 百万 token
上下文窗口 1049K tokens
国内可用性 不稳定
最近核验 2026-05-12
同档对手价格
模型 输入 输出 国内
Claude Sonnet 4.6 · Anthropic $3.00 $15.00 需代理
GPT-5.4 · OpenAI $2.50 $15.00 需代理
Qwen3.6 Max Preview · Alibaba (阿里云百炼) $1.04 $6.24 可用
Claude Haiku 4.5 · Anthropic $1.00 $5.00 需代理

什么时候选它 / 别选它

适合场景
  • 长文档 RAG、百页合同/论文分析——1M 上下文 + 便宜价
  • 需要兼顾中文与多语言的混合场景(SuperCLUE 海外榜第 2)
  • 对响应速度敏感的产品——输出 129.5 token/s 是 Claude 的 2.3 倍
不适合场景
  • LMArena Text 排到第 4,但 Vision/Search 都被 Claude 压一头
  • 国内无代理——Google AI Studio 不开放大陆 IP
  • 对 reasoning effort 调档敏感的——Gemini 没有 AA 那种 xhigh/high/medium 多档

不选它的话,看看这些

Gemini 3.1 Pro Preview 常被拿来比的对