LLMRank 中文 LLM 综合参考

国内线 · 通用 vs 前端黑马

DeepSeek V4 Pro vs GLM 5.1

DeepSeek V4 Pro

DeepSeek · 🇨🇳

开源、便宜、SuperCLUE 国内第二，性价比怪兽的旗舰版

覆盖数据源 2 / 6

Z.ai (智谱) · 🇨🇳

前端工程黑马——LMArena WebDev 第 5 名，比 Claude Sonnet 还前面

覆盖数据源 3 / 6

TL;DR

DeepSeek 综合分均衡 + SuperCLUE 国内 #2，GLM-5.1 LMArena WebDev 第 5 是前端黑马——选型按场景拆。

关键差异

AA Intelligence：DeepSeek V4 Pro (51.51) > GLM-5.1 (51.41)，几乎打平
LMArena WebDev：GLM-5.1 第 5，V4 Pro 没进 Top 10——前端方向 GLM 完胜
输出价：V4 Pro $0.87 vs GLM 5.1 $3.08，V4 Pro 便宜 72%

关键指标逐项对比

AA 数据抓取于 2026-07-11 · 价格抓取于 2026-07-11

指标	DeepSeek V4 Pro	GLM 5.1	优胜
AA 综合智能（Intelligence Index）越高越好	—	40.00	—
输入价格（$ / 百万 token）越低越好	$0.43	$0.97	A
输出价格（$ / 百万 token）越低越好	$0.87	$3.04	A
输出速度（token / 秒）越高越好	—	66	—
上下文窗口越大越好	1049K	203K	A

价格差距：GLM 5.1 输出价比 DeepSeek V4 Pro 贵 3.49 倍（$3.036 vs $0.87）

A = DeepSeek V4 Pro，B = GLM 5.1。空缺值表示该数据源未收录此模型，不参与优胜判定。

LMArena · 人类盲测各分类

抓取于 2026-07-11

分类	DeepSeek V4 Pro	GLM 5.1
💻 Code	未进 Top 10	#14 · 1526.67
🏆 Overall	未进 Top 10	#25 · 1472.1078583611788

只显示 Top 10 内出现的分类。同一模型不同变体（thinking / search 等）取排名最靠前的。LMArena 是人类盲测两两投票算的 Elo 分。

SuperCLUE · 中文能力测评

2026-05

维度	DeepSeek V4 Pro	GLM 5.1
收录条目	DeepSeek-V4-Pro	未收录
综合总分	70.48 · 榜单 #6	—
代码生成	74.95	—
数学推理	71.93	—
智能体(任务规划)	78.12	—
精确指令遵循	48.57	—

GLM 5.1 未收录：SuperCLUE 5 月榜 GLM-5.1 总分 63.24，国内第五（并列）。

国内可用性 & OpenRouter 用量

DeepSeek V4 Pro

国内可用性可用
OpenRouter 本周未进 Top 10
价格最近核验 2026-07-11

GLM 5.1

国内可用性可用
OpenRouter 本周未进 Top 10
价格最近核验 2026-07-11

OpenRouter 用量榜抓取于 2026-07-11，反映过去 7 天聚合 API 用量。免费层模型经常冲到榜首，参考时注意是「跑量」而不是「能力」。

怎么选

选 DeepSeek V4 Pro，如果你：

通用代码/中文写作均衡主力、私有化部署（开源权重）、SuperCLUE 国内第 2 的中文场景。

选 GLM 5.1，如果你：

前端 UI 开发（LMArena WebDev 第 5 国内最高，比 Claude Sonnet 4.6 还前面）、智谱合规场景。

还在比的其他对

跨境 · 国际顶级 vs 国内 #1

Claude Opus 4.7 vs DeepSeek V4 Pro

跨境 · 国际新王 vs 国内 #1

Claude Opus 4.8 vs DeepSeek V4 Pro

跨境 · 国际主力 vs 国内旗舰

Claude Sonnet 4.6 vs DeepSeek V4 Pro

同家族 · 智谱升级

GLM-5 vs GLM 5.1

同家族 · GLM 5.1 vs 5.2

GLM 5.1 vs GLM 5.2

国内线 · 前端 vs 通用

GLM 5.1 vs Kimi K2.6

← 看所有对比回模型库 →