🤖 AI 模型每日排行榜
2026年4月23日 · 星期四 · 第147期
综合能力 TOP 10
基于五维评分框架(领域知识、任务能力、交互可控性、成本效率、生态部署)的综合评分
| 排名 | 模型 | 公司 | 综合评分 | 核心优势 | 参考价格 |
|---|---|---|---|---|---|
| 1 |
Claude Opus 4.7
Anthropic · 旗舰级
|
9.2 | 编程、法律分析、长上下文 | $5/$25 | |
| 2 |
GPT-5.4 High
OpenAI · 旗舰级
|
9.0 | 推理、数学、工具调用 | $2.5/$15 | |
| 3 |
Gemini 3.1 Pro
Google · 旗舰级
|
8.8 | 多模态、长上下文、生态 | $1.25/$10 | |
| 4 |
Claude Sonnet 4.6
Anthropic · 平衡型
|
8.6 | 性价比、编程、写作 | $3/$15 | |
| 5 |
Qwen3.6 Plus
阿里 · 旗舰开源
|
8.5 | 编程、中文、开源生态 | ¥2/百万 | |
| 6 |
Llama 4 Maverick
Meta · 开源旗舰
|
8.3 | 开源、多模态、自托管 | 免费开源 | |
| 7 |
Grok 4.20
xAI · 推理型
|
8.2 | 推理、实时搜索、低幻觉 | $2/$6 | |
| 8 |
豆包 2.0 Pro
字节 · 旗舰级
|
8.0 | 中文、视频理解、高并发 | ¥3.2/百万 | |
| 9 |
GLM-5
智谱AI · 开源旗舰
|
7.9 | 编程、Agent能力、开源 | $1/$4 | |
| 10 |
DeepSeek V3.2
DeepSeek · 性价比
|
7.7 | 推理、代码、成本低 | $0.27/$1.1 |
五维评分框架
各维度满分10分,综合考量模型的全面能力
通用知识广度、垂直领域术语
推理、代码、多模态、上下文
指令遵循、幻觉率、角色一致性
单价、速度、稳定性
开源、工具生态、部署方式
TOP 3 模型五维对比
| 模型 | 领域知识 | 任务能力 | 交互可控 | 成本效率 | 生态部署 |
|---|---|---|---|---|---|
| Claude Opus 4.7 | 9.3 | 9.5 | 9.4 | 8.0 | 8.5 |
| GPT-5.4 High | 9.2 | 9.3 | 8.8 | 8.5 | 9.2 |
| Gemini 3.1 Pro | 9.0 | 8.9 | 8.5 | 9.0 | 9.0 |
国际厂商模型排行
| 公司 | 最新模型 | 发布时间 | 核心亮点 | API定价 |
|---|---|---|---|---|
| OpenAI | GPT-5.4 / GPT-5.4 Pro | 2026.03.05 | 1M上下文、思维模式、工具调用 | $2.5-30 |
| Anthropic | Claude Opus 4.7 | 2026.04.16 | LMSYS三榜第一、SWE-bench 87.6% | $5/$25 |
| Gemini 3.1 Pro | 2026.02.19 | 2M上下文、多模态、Workspace集成 | $1.25/$10 | |
| Meta | Llama 4 Scout/Maverick | 2026.04.05 | 10M上下文、开源、多模态 | 免费开源 |
| xAI | Grok 4.20 Beta | 2026.03 | 200万上下文、低幻觉、实时搜索 | $2/$6 |
| Mistral AI | Mistral Large 3 | 2025.07 | 欧洲合规、自托管、La Plateforme | $2/$8 |
国内厂商模型排行
| 公司 | 最新模型 | 发布时间 | 核心亮点 | API定价 |
|---|---|---|---|---|
| 阿里 | Qwen3.6 Plus / Qwen3.6-35B-A3B | 2026.04 | 编程全球第二、开源10亿下载 | ¥0.8-2/百万 |
| 字节 | 豆包 2.0 Pro/Lite/Mini | 2026.02.14 | 3.45亿月活、IMO/ICPC金牌 | ¥0.6-16/百万 |
| 百度 | ERNIE 5.0 | 2026.01.22 | 2.4万亿参数、原生全模态 | 基础免费 |
| 月之暗面 | Kimi K2.5 | 2026.Q1 | 超长上下文、Agent能力 | ¥15/百万 |
| DeepSeek | V3.2 (V4预计月底) | 2025.12.01 | 极致性价比、工具调用 | $0.27/百万 |
| 腾讯 | 混元 2.0 | 2026.04 | 406B参数、256K上下文 | 企业定制 |
| 智谱AI | GLM-5 | 2026.04 | 开源SOTA、Agent能力 | $1/$4 |
| MiniMax | M2.7 | 2026.03.18 | 自进化模型、OpenClaw框架 | ¥0.3/百万 |
| 华为 | 盘古 5.0 | 2026.Q1 | 昇腾算力、行业定制 | 企业定制 |
| 科大讯飞 | 星火 X2 | 2026.02 | 语音优势、教育/医疗落地 | ¥0.5/百万 |
11个场景 TOP 10 排名
📄 多文件信息提取场景 TOP 10
从多个文档、PDF、网页中提取关键信息并整合
- 1Claude Opus 4.7Anthropic
- 2Gemini 3.1 ProGoogle
- 3GPT-5.4OpenAI
- 4ERNIE 5.0百度
- 5豆包 2.0 Pro字节
- 6Qwen3.6 Plus阿里
- 7GLM-5智谱AI
- 8Claude Sonnet 4.6Anthropic
- 9Kimi K2.5月之暗面
- 10Llama 4 MaverickMeta
⚖️ 文件内容对比场景 TOP 10
对比文档差异、版本差异、合同条款对比
- 1Claude Opus 4.7Anthropic
- 2GPT-5.4OpenAI
- 3Claude Sonnet 4.6Anthropic
- 4Gemini 3.1 ProGoogle
- 5ERNIE 5.0百度
- 6豆包 2.0 Pro字节
- 7Qwen3.6 Plus阿里
- 8Kimi K2.5月之暗面
- 9GLM-5智谱AI
- 10DeepSeek V3.2DeepSeek
✍️ 创意写作与内容生成 TOP 10
小说、散文、营销文案、社交媒体内容
- 1Claude Opus 4.7Anthropic
- 2GPT-5.4OpenAI
- 3Claude Sonnet 4.6Anthropic
- 4ERNIE 5.0百度
- 5豆包 2.0 Pro字节
- 6Qwen3.6 Plus阿里
- 7Gemini 3.1 ProGoogle
- 8Llama 4 MaverickMeta
- 9Kimi K2.5月之暗面
- 10GLM-5智谱AI
🎬 视频脚本与分镜策划 TOP 10
短视频脚本、分镜设计、剧情策划
- 1GPT-5.4OpenAI
- 2Claude Opus 4.7Anthropic
- 3Claude Sonnet 4.6Anthropic
- 4豆包 2.0 Pro字节
- 5ERNIE 5.0百度
- 6Qwen3.6 Plus阿里
- 7Gemini 3.1 ProGoogle
- 8Kimi K2.5月之暗面
- 9Llama 4 MaverickMeta
- 10GLM-5智谱AI
🎥 视频生成与制作 TOP 10
AI视频生成模型排名(非语言模型)
- 1HappyHorse-1.0阿里
- 2Seedance 2.0字节
- 3Sora 2.0OpenAI
- 4Veo 2Google
- 5Kling 3.0快手
- 6Pika 2.2Pika
- 7Runway Gen-4Runway
- 8Luma RayLuma AI
- 9Kling 2.5快手
- 10CogVideoX智谱AI
🎨 图片生成与设计 TOP 10
AI图像生成模型排名
- 1DALL-E 4OpenAI
- 2 Imagen 3Google
- 3Midjourney v7Midjourney
- 4FLUX 2.0 ProBlackForest
- 5Stable Diffusion 4Stability AI
- 6通义万相 3.0阿里
- 7即梦 3.0字节
- 8Leonardo AILeonardo
- 9Adobe Firefly 4Adobe
- 10文心一格 4.0百度
💻 代码编程与Debug TOP 10
代码生成、调试、代码审查
- 1Claude Opus 4.7Anthropic
- 2GPT-5.4 CodexOpenAI
- 3Qwen3.6 Plus阿里
- 4Claude Sonnet 4.6Anthropic
- 5GLM-5智谱AI
- 6DeepSeek Coder V3DeepSeek
- 7Gemini 3.1 ProGoogle
- 8Llama 4 MaverickMeta
- 9豆包 2.0 Code字节
- 10Grok 4.20xAI
📊 数据分析与报告生成 TOP 10
数据分析、报表生成、洞察提取
- 1Claude Opus 4.7Anthropic
- 2GPT-5.4OpenAI
- 3Gemini 3.1 ProGoogle
- 4Claude Sonnet 4.6Anthropic
- 5ERNIE 5.0百度
- 6豆包 2.0 Pro字节
- 7Qwen3.6 Plus阿里
- 8GLM-5智谱AI
- 9Kimi K2.5月之暗面
- 10DeepSeek V3.2DeepSeek
🌐 多语言翻译与本地化 TOP 10
翻译、本地化、跨语言沟通
- 1GPT-5.4OpenAI
- 2Claude Opus 4.7Anthropic
- 3Gemini 3.1 ProGoogle
- 4Qwen3.6 Plus阿里
- 5Claude Sonnet 4.6Anthropic
- 6Llama 4 MaverickMeta
- 7GLM-5智谱AI
- 8豆包 2.0 Pro字节
- 9ERNIE 5.0百度
- 10DeepSeek V3.2DeepSeek
🎙️ 语音对话 TOP 10
语音识别、语音合成、实时对话
- 1GPT-5 VoiceOpenAI
- 2Gemini 2.0 FlashGoogle
- 3星火 X2科大讯飞
- 4豆包语音大模型字节
- 5Claude VoiceAnthropic
- 6Grok AudioxAI
- 7通义听悟阿里
- 8Whisper V4OpenAI
- 9CosyVoice 2阿里
- 10SenseVoice阿里
🏠 日常通用 TOP 10
日常问答、闲聊、通用知识
- 1GPT-5.4OpenAI
- 2Claude Opus 4.7Anthropic
- 3Gemini 3.1 ProGoogle
- 4Claude Sonnet 4.6Anthropic
- 5豆包 2.0 Pro字节
- 6Qwen3.6 Plus阿里
- 7ERNIE 5.0百度
- 8Llama 4 MaverickMeta
- 9Grok 4.20xAI
- 10Kimi K2.5月之暗面
行业动态
Claude Opus 4.7 正式发布
Anthropic 于4月16日发布 Claude Opus 4.7,成为全球首个同时占据 LMSYS 三大榜单(文本、代码、搜索)第一的模型。编程能力 SWE-bench 达 87.6%,视觉能力提升3倍。
Qwen3.6 Plus 编程登顶
阿里 Qwen3.6 Plus 以 1452 分登顶 Code Arena 编程榜单,超越 GPT-5.4。OpenRouter 周调用量曾突破 4.6 万亿 Token,刷新全球纪录。
Llama 4 正式发布
Meta 发布 Llama 4 系列,Scout 版本拥有 10M token 上下文(全球最大开源模型),Maverick 版本性能对标 GPT-4o。
DeepSeek V4 月底发布
DeepSeek V4 预计本月底正式发布,将具备百万 Token 上下文、原生多模态、LTM 长期记忆等多项突破,推理成本仅为国际主流的 1/70。
HappyHorse 视频模型屠榜
阿里 HappyHorse-1.0 视频模型以 1378(图生视频 1411)分双榜全球第一,超第二名 Seedance 2.0 达 105 分,首创音画一体生成。
中美模型差距缩至 2.7%
斯坦福 HAI 《2026 AI 指数报告》显示,中美顶级模型在基准测试上的差距已收窄至 2.7%,中国 AI 正式进入全球第一梯队。