国内线 · 智谱 vs 阿里
GLM 5.1 vs Qwen3.6 Max Preview
TL;DR
GLM-5.1 LMArena WebDev 第 5 前端黑马 + 便宜 40%,Qwen3.6 Max 1M 上下文 + 阿里云背书——前端选 GLM,长文档企业场景选 Qwen。
关键差异
- AA Intelligence:Qwen3.6 Max (51.81) > GLM-5.1 (51.41),几乎打平
- LMArena WebDev:GLM-5.1 第 5,Qwen3.6 Max 没进 Top 10
- 输出价:GLM $4.4 vs Qwen $7.8,GLM 便宜近 45%
- 速度:GLM 56.8 token/s > Qwen 37.9 token/s,GLM 快 50%
关键指标逐项对比
AA 数据抓取于 2026-05-12 · 价格抓取于 2026-05-12| 指标 | GLM 5.1 | Qwen3.6 Max Preview | 优胜 |
|---|---|---|---|
| AA 综合智能(Intelligence Index) 越高越好 | 51.41 | 51.81 | B |
| AA 代码能力(Coding Index) 越高越好 | 43.37 | 44.92 | B |
| AA Agent 能力(Agentic Index) 越高越好 | 67.05 | 64.83 | A |
| 输入价格($ / 百万 token) 越低越好 | $0.98 | $1.04 | A |
| 输出价格($ / 百万 token) 越低越好 | $3.08 | $6.24 | A |
| 输出速度(token / 秒) 越高越好 | 56.8 | 37.9 | A |
| 上下文窗口 越大越好 | 203K | 262K | B |
价格差距:Qwen3.6 Max Preview 输出价比 GLM 5.1 贵 2.03 倍($6.24 vs $3.08)
A = GLM 5.1,B = Qwen3.6 Max Preview。空缺值表示该数据源未收录此模型,不参与优胜判定。
LMArena · 人类盲测各分类
抓取于 2026-05-12| 分类 | GLM 5.1 | Qwen3.6 Max Preview |
|---|---|---|
| 前端开发(WebDev) | #5 · 1531 | 未进 Top 10 |
只显示 Top 10 内出现的分类。同一模型不同变体(thinking / search 等)取排名最靠前的。LMArena 是人类盲测两两投票算的 Elo 分。
国内可用性 & OpenRouter 用量
GLM 5.1
- 国内可用性 可用
- OpenRouter 本周 未进 Top 10
- 价格最近核验 2026-05-12
Qwen3.6 Max Preview
- 国内可用性 可用
- OpenRouter 本周 未进 Top 10
- 价格最近核验 2026-05-12
OpenRouter 用量榜抓取于 2026-05-12,反映过去 7 天聚合 API 用量。免费层模型经常冲到榜首,参考时注意是「跑量」而不是「能力」。
怎么选
选 GLM 5.1,如果你:
前端 UI 开发(LMArena WebDev 第 5 国内最高)、智谱合规场景、性价比敏感。
选 Qwen3.6 Max Preview,如果你:
1M 上下文 + 中文长文档、阿里云生态(SLA/发票合规)、政企客户。