模型对比库
18 组主流 LLM 两两 PK:AA 评测、LMArena 排名、SuperCLUE 中文、API 价格、国内可用性逐项对比,配选型建议。 不替你算「综合分」,给你看每一项各自谁强。
国际线 · 顶级对决
国际线 · 主力 vs 旗舰
国际线 · 顶级 vs 长文档之王
国际线 · 长文档 vs 做题
国际线 · 主力对决
同家族升级
同家族 · Flash vs Pro
国内线 · 双雄对决
国内线 · 前端 vs 通用
国内线 · Moonshot vs 阿里
国内线 · 通用 vs 前端黑马
国内线 · 开源 vs 阿里云背书
国内线 · 智谱 vs 阿里
国内线 · Moonshot vs 小米黑马
国内线 · DeepSeek vs 小米黑马
跨境 · 国际主力 vs 国内旗舰
Claude Sonnet 4.6
vs DeepSeek V4 Pro
Claude Sonnet 4.6 国际线主力(OpenRouter 用量 #3),DeepSeek V4 Pro 国内 #2 + 便宜 4 倍 + 不用代理——预算紧 + 国内场景直接选 DeepSeek。
Anthropic · DeepSeek · 🇨🇳
Claude Sonnet 4.6
vs Kimi K2.6
AA 智能/代码分接近(差 2 分以内),但 Kimi K2.6 便宜 4 倍 + 不用代理 + OpenRouter 用量都在第 2/3——国内开发场景 Kimi 是更高杠杆的选择。
Anthropic · Moonshot AI · 🇨🇳
跨境 · 国际旗舰 vs 国内 #1
所有对比的数据来自 5 个独立数据源:Artificial Analysis、LMArena、SuperCLUE、OpenRouter 用量、OpenRouter 价格。每页都标注抓取日期,数据缺失透明可见。