🤖 AI 模型每日排行榜

2026年4月23日 · 星期四 · 第147期

16
监测公司
50+
活跃模型
11
应用场景
5
评分维度
🏆

综合能力 TOP 10

基于五维评分框架(领域知识、任务能力、交互可控性、成本效率、生态部署)的综合评分

排名 模型 公司 综合评分 核心优势 参考价格
1
Claude Opus 4.7
Anthropic · 旗舰级
9.2 编程、法律分析、长上下文 $5/$25
2
GPT-5.4 High
OpenAI · 旗舰级
9.0 推理、数学、工具调用 $2.5/$15
3
Gemini 3.1 Pro
Google · 旗舰级
8.8 多模态、长上下文、生态 $1.25/$10
4
Claude Sonnet 4.6
Anthropic · 平衡型
8.6 性价比、编程、写作 $3/$15
5
Qwen3.6 Plus
阿里 · 旗舰开源
8.5 编程、中文、开源生态 ¥2/百万
6
Llama 4 Maverick
Meta · 开源旗舰
8.3 开源、多模态、自托管 免费开源
7
Grok 4.20
xAI · 推理型
8.2 推理、实时搜索、低幻觉 $2/$6
8
豆包 2.0 Pro
字节 · 旗舰级
8.0 中文、视频理解、高并发 ¥3.2/百万
9
GLM-5
智谱AI · 开源旗舰
7.9 编程、Agent能力、开源 $1/$4
10
DeepSeek V3.2
DeepSeek · 性价比
7.7 推理、代码、成本低 $0.27/$1.1
📊

五维评分框架

各维度满分10分,综合考量模型的全面能力

🏛️ 领域知识深度
8.9

通用知识广度、垂直领域术语

⚡ 任务专项能力
9.1

推理、代码、多模态、上下文

🎮 交互与可控性
8.8

指令遵循、幻觉率、角色一致性

💰 成本与效率
7.5

单价、速度、稳定性

🌐 生态与部署
8.2

开源、工具生态、部署方式

TOP 3 模型五维对比

模型 领域知识 任务能力 交互可控 成本效率 生态部署
Claude Opus 4.7 9.3 9.5 9.4 8.0 8.5
GPT-5.4 High 9.2 9.3 8.8 8.5 9.2
Gemini 3.1 Pro 9.0 8.9 8.5 9.0 9.0
🌍

国际厂商模型排行

公司 最新模型 发布时间 核心亮点 API定价
OpenAI GPT-5.4 / GPT-5.4 Pro 2026.03.05 1M上下文、思维模式、工具调用 $2.5-30
Anthropic Claude Opus 4.7 2026.04.16 LMSYS三榜第一、SWE-bench 87.6% $5/$25
Google Gemini 3.1 Pro 2026.02.19 2M上下文、多模态、Workspace集成 $1.25/$10
Meta Llama 4 Scout/Maverick 2026.04.05 10M上下文、开源、多模态 免费开源
xAI Grok 4.20 Beta 2026.03 200万上下文、低幻觉、实时搜索 $2/$6
Mistral AI Mistral Large 3 2025.07 欧洲合规、自托管、La Plateforme $2/$8
🇨🇳

国内厂商模型排行

公司 最新模型 发布时间 核心亮点 API定价
阿里 Qwen3.6 Plus / Qwen3.6-35B-A3B 2026.04 编程全球第二、开源10亿下载 ¥0.8-2/百万
字节 豆包 2.0 Pro/Lite/Mini 2026.02.14 3.45亿月活、IMO/ICPC金牌 ¥0.6-16/百万
百度 ERNIE 5.0 2026.01.22 2.4万亿参数、原生全模态 基础免费
月之暗面 Kimi K2.5 2026.Q1 超长上下文、Agent能力 ¥15/百万
DeepSeek V3.2 (V4预计月底) 2025.12.01 极致性价比、工具调用 $0.27/百万
腾讯 混元 2.0 2026.04 406B参数、256K上下文 企业定制
智谱AI GLM-5 2026.04 开源SOTA、Agent能力 $1/$4
MiniMax M2.7 2026.03.18 自进化模型、OpenClaw框架 ¥0.3/百万
华为 盘古 5.0 2026.Q1 昇腾算力、行业定制 企业定制
科大讯飞 星火 X2 2026.02 语音优势、教育/医疗落地 ¥0.5/百万
🎯

11个场景 TOP 10 排名

📄 多文件信息提取场景 TOP 10

从多个文档、PDF、网页中提取关键信息并整合

  • 1Claude Opus 4.7Anthropic
  • 2Gemini 3.1 ProGoogle
  • 3GPT-5.4OpenAI
  • 4ERNIE 5.0百度
  • 5豆包 2.0 Pro字节
  • 6Qwen3.6 Plus阿里
  • 7GLM-5智谱AI
  • 8Claude Sonnet 4.6Anthropic
  • 9Kimi K2.5月之暗面
  • 10Llama 4 MaverickMeta

⚖️ 文件内容对比场景 TOP 10

对比文档差异、版本差异、合同条款对比

  • 1Claude Opus 4.7Anthropic
  • 2GPT-5.4OpenAI
  • 3Claude Sonnet 4.6Anthropic
  • 4Gemini 3.1 ProGoogle
  • 5ERNIE 5.0百度
  • 6豆包 2.0 Pro字节
  • 7Qwen3.6 Plus阿里
  • 8Kimi K2.5月之暗面
  • 9GLM-5智谱AI
  • 10DeepSeek V3.2DeepSeek

✍️ 创意写作与内容生成 TOP 10

小说、散文、营销文案、社交媒体内容

  • 1Claude Opus 4.7Anthropic
  • 2GPT-5.4OpenAI
  • 3Claude Sonnet 4.6Anthropic
  • 4ERNIE 5.0百度
  • 5豆包 2.0 Pro字节
  • 6Qwen3.6 Plus阿里
  • 7Gemini 3.1 ProGoogle
  • 8Llama 4 MaverickMeta
  • 9Kimi K2.5月之暗面
  • 10GLM-5智谱AI

🎬 视频脚本与分镜策划 TOP 10

短视频脚本、分镜设计、剧情策划

  • 1GPT-5.4OpenAI
  • 2Claude Opus 4.7Anthropic
  • 3Claude Sonnet 4.6Anthropic
  • 4豆包 2.0 Pro字节
  • 5ERNIE 5.0百度
  • 6Qwen3.6 Plus阿里
  • 7Gemini 3.1 ProGoogle
  • 8Kimi K2.5月之暗面
  • 9Llama 4 MaverickMeta
  • 10GLM-5智谱AI

🎥 视频生成与制作 TOP 10

AI视频生成模型排名(非语言模型)

  • 1HappyHorse-1.0阿里
  • 2Seedance 2.0字节
  • 3Sora 2.0OpenAI
  • 4Veo 2Google
  • 5Kling 3.0快手
  • 6Pika 2.2Pika
  • 7Runway Gen-4Runway
  • 8Luma RayLuma AI
  • 9Kling 2.5快手
  • 10CogVideoX智谱AI

🎨 图片生成与设计 TOP 10

AI图像生成模型排名

  • 1DALL-E 4OpenAI
  • 2 Imagen 3Google
  • 3Midjourney v7Midjourney
  • 4FLUX 2.0 ProBlackForest
  • 5Stable Diffusion 4Stability AI
  • 6通义万相 3.0阿里
  • 7即梦 3.0字节
  • 8Leonardo AILeonardo
  • 9Adobe Firefly 4Adobe
  • 10文心一格 4.0百度

💻 代码编程与Debug TOP 10

代码生成、调试、代码审查

  • 1Claude Opus 4.7Anthropic
  • 2GPT-5.4 CodexOpenAI
  • 3Qwen3.6 Plus阿里
  • 4Claude Sonnet 4.6Anthropic
  • 5GLM-5智谱AI
  • 6DeepSeek Coder V3DeepSeek
  • 7Gemini 3.1 ProGoogle
  • 8Llama 4 MaverickMeta
  • 9豆包 2.0 Code字节
  • 10Grok 4.20xAI

📊 数据分析与报告生成 TOP 10

数据分析、报表生成、洞察提取

  • 1Claude Opus 4.7Anthropic
  • 2GPT-5.4OpenAI
  • 3Gemini 3.1 ProGoogle
  • 4Claude Sonnet 4.6Anthropic
  • 5ERNIE 5.0百度
  • 6豆包 2.0 Pro字节
  • 7Qwen3.6 Plus阿里
  • 8GLM-5智谱AI
  • 9Kimi K2.5月之暗面
  • 10DeepSeek V3.2DeepSeek

🌐 多语言翻译与本地化 TOP 10

翻译、本地化、跨语言沟通

  • 1GPT-5.4OpenAI
  • 2Claude Opus 4.7Anthropic
  • 3Gemini 3.1 ProGoogle
  • 4Qwen3.6 Plus阿里
  • 5Claude Sonnet 4.6Anthropic
  • 6Llama 4 MaverickMeta
  • 7GLM-5智谱AI
  • 8豆包 2.0 Pro字节
  • 9ERNIE 5.0百度
  • 10DeepSeek V3.2DeepSeek

🎙️ 语音对话 TOP 10

语音识别、语音合成、实时对话

  • 1GPT-5 VoiceOpenAI
  • 2Gemini 2.0 FlashGoogle
  • 3星火 X2科大讯飞
  • 4豆包语音大模型字节
  • 5Claude VoiceAnthropic
  • 6Grok AudioxAI
  • 7通义听悟阿里
  • 8Whisper V4OpenAI
  • 9CosyVoice 2阿里
  • 10SenseVoice阿里

🏠 日常通用 TOP 10

日常问答、闲聊、通用知识

  • 1GPT-5.4OpenAI
  • 2Claude Opus 4.7Anthropic
  • 3Gemini 3.1 ProGoogle
  • 4Claude Sonnet 4.6Anthropic
  • 5豆包 2.0 Pro字节
  • 6Qwen3.6 Plus阿里
  • 7ERNIE 5.0百度
  • 8Llama 4 MaverickMeta
  • 9Grok 4.20xAI
  • 10Kimi K2.5月之暗面
📰

行业动态

🆕 重磅发布

Claude Opus 4.7 正式发布

Anthropic 于4月16日发布 Claude Opus 4.7,成为全球首个同时占据 LMSYS 三大榜单(文本、代码、搜索)第一的模型。编程能力 SWE-bench 达 87.6%,视觉能力提升3倍。

🔥 国产崛起

Qwen3.6 Plus 编程登顶

阿里 Qwen3.6 Plus 以 1452 分登顶 Code Arena 编程榜单,超越 GPT-5.4。OpenRouter 周调用量曾突破 4.6 万亿 Token,刷新全球纪录。

🌍 开源发布

Llama 4 正式发布

Meta 发布 Llama 4 系列,Scout 版本拥有 10M token 上下文(全球最大开源模型),Maverick 版本性能对标 GPT-4o。

⏳ 即将发布

DeepSeek V4 月底发布

DeepSeek V4 预计本月底正式发布,将具备百万 Token 上下文、原生多模态、LTM 长期记忆等多项突破,推理成本仅为国际主流的 1/70。

🎥 视频模型

HappyHorse 视频模型屠榜

阿里 HappyHorse-1.0 视频模型以 1378(图生视频 1411)分双榜全球第一,超第二名 Seedance 2.0 达 105 分,首创音画一体生成。

📊 市场格局

中美模型差距缩至 2.7%

斯坦福 HAI 《2026 AI 指数报告》显示,中美顶级模型在基准测试上的差距已收窄至 2.7%,中国 AI 正式进入全球第一梯队。