📢 今日简报

🆕 新模型 / 版本

🔹 Claude Opus 4.7(4.16) - SWE-bench 87.6%,视觉能力3倍提升,指令执行近乎零偏差
🔹 Qwen3.6-35B-A3B(4.16) - 开源MoE模型,30亿激活参数逼近顶级闭源模型
🔹 GLM-5.1(4.08) - 智谱开源旗舰,独立工作8小时

📊 评分速览 TOP 5

🥇 Claude Opus 4.7 - 综合评分 9.2 | 编程/推理双冠王
🥈 GPT-5.4 - 综合评分 9.0 | 原生计算机使用、多模态领先
🥉 Gemini 3.1 Pro - 综合评分 8.8 | MMMU-Pro 多模态冠军
4️⃣ Qwen3.6 Plus - 综合评分 8.5 | 性价比之王
5️⃣ GLM-5.1 - 综合评分 8.4 | 国产开源第一

🔄 场景排名变动

📈 Claude Opus 4.7 在编程/Debug场景超越 GPT-5.4
📈 MiniMax M2.7 开源后跻身软件工程TOP 5
📈 Kimi K2.5 Agent Swarm 模式在长程任务场景爆发

📌 今日一句话总结

Claude Opus 4.7 以 87.6% SWE-bench 刷新编程基准记录,GPT-6 即将于4月14日发布,中国大模型周调用量连续五周超越美国4.27倍,AI竞争进入新纪元。

🔥 今日热点动态

🚀

GPT-6 官宣4月14日发布

OpenAI宣布代号"Spud"的新一代旗舰模型,参数量5-6万亿(MoE架构),支持200万Token上下文,代码/推理/智能体任务性能较GPT-5.4提升约40%。

📅 4月9日官宣
🇨🇳

中国大模型周调用量超越美国4.27倍

根据OpenRouter数据,中国AI大模型周调用量突破12.96万亿Token,环比暴涨31.48%,连续第五周超越美国。阿里Qwen3.6 Plus以4.6万亿Token登顶全球榜首。

📅 4月6日数据
🆓

MiniMax M2.7 全球开源

MiniMax正式全球开源其首个具备自我进化能力的大模型M2.7。开源首日华为昇腾、NVIDIA等完成0 Day接入适配。SWE-Pro测试56.22%正确率追平GPT-5.3-Codex。

📅 4月12日
💰

DeepSeek 启动首次外部融资

据报道DeepSeek正与投资者洽谈首轮外部股权融资,目标估值不低于100亿美元,募集不少于3亿美元。公司已沉默5个月未发布新模型。

📅 4月18日

📊 五维评分榜

评分说明:每项1-10分 | ①领域知识深度 ②任务专项能力 ③交互与可控性 ④成本与效率 ⑤生态与部署

模型 ①知识深度 ②专项能力 ③交互可控 ④成本效率 ⑤生态部署 综合
Claude Opus 4.7 Anthropic
9.5
9.5
9.3
7.0
9.0
9.2
GPT-5.4 Pro OpenAI
9.3
9.2
9.0
8.0
9.5
9.0
Gemini 3.1 Pro Google
9.2
9.0
8.5
8.5
9.0
8.8
Qwen3.6 Plus 阿里
8.5
9.0
8.5
9.5
8.5
8.5
GLM-5.1 智谱AI
8.3
8.8
8.3
8.8
8.0
8.4
Kimi K2.5 月之暗面
8.3
8.8
8.5
8.5
7.8
8.3
Llama 4 Maverick Meta
8.0
8.3
8.0
9.0
9.3
8.3
MiniMax M2.7 MiniMax
7.8
8.5
8.0
8.8
7.5
8.1
DeepSeek V3.2 DeepSeek
8.0
8.3
8.0
9.5
7.5
8.0
Claude Sonnet 4.6 Anthropic
8.5
8.3
8.8
7.8
8.5
8.2
Grok 4.20 xAI
8.0
8.0
7.8
8.0
7.0
7.8
文心5.0 百度
8.0
8.0
7.8
8.5
7.5
7.8
Doubao-Seed-2.0 字节
7.5
8.0
8.0
9.0
7.0
7.7
Mistral Medium 3 Mistral
7.5
7.8
7.8
8.0
7.3
7.6

🏆 场景TOP 10 排名

📄 1. 多文件信息提取
  1. 1Gemini 3.1 ProGoogle9.4
  2. 2Claude Opus 4.7Anthropic9.3
  3. 3GPT-5.4OpenAI9.2
  4. 4Kimi K2.5月之暗面9.0
  5. 5Qwen3.6 Plus阿里8.8
  6. 6GLM-5.1智谱AI8.7
  7. 7文心5.0百度8.5
  8. 8Llama 4 ScoutMeta8.3
  9. 9Doubao-Seed-2.0字节8.0
  10. 10Gemini 2.5 FlashGoogle7.8
⚖️ 2. 文件内容对比
  1. 1Claude Opus 4.7Anthropic9.5
  2. 2GPT-5.4OpenAI9.3
  3. 3Gemini 3.1 ProGoogle9.2
  4. 4Qwen3.6 Plus阿里8.9
  5. 5GLM-5.1智谱AI8.8
  6. 6Kimi K2.5月之暗面8.7
  7. 7Claude Sonnet 4.6Anthropic8.5
  8. 8文心5.0百度8.3
  9. 9DeepSeek V3.2DeepSeek8.0
  10. 10Doubao-Seed-2.0字节7.8
✍️ 3. 创意写作与内容生成
  1. 1GPT-5.4OpenAI9.5
  2. 2Claude Opus 4.7Anthropic9.3
  3. 3Qwen3.6 Plus阿里9.0
  4. 4Gemini 3.1 ProGoogle8.8
  5. 5GLM-5智谱AI8.7
  6. 6Kimi K2.5月之暗面8.6
  7. 7文心5.0百度8.5
  8. 8Muse SparkMeta8.4
  9. 9Claude Sonnet 4.6Anthropic8.3
  10. 10Doubao-Seed-2.0字节8.0
🎬 4. 视频脚本与分镜策划
  1. 1GPT-5.4OpenAI9.3
  2. 2Qwen3.5-Omni阿里9.2
  3. 3Gemini 3.1 ProGoogle9.0
  4. 4Kimi K2.5月之暗面8.8
  5. 5Claude Opus 4.7Anthropic8.7
  6. 6GLM-5V-Turbo智谱AI8.5
  7. 7Doubao-Seed-2.0字节8.3
  8. 8文心5.0百度8.0
  9. 9Llama 4 MaverickMeta7.8
  10. 10Gemma 4 31BGoogle7.5
🎥 5. 视频生成与制作
  1. 1HappyHorse-1.0阿里9.5
  2. 2Seedance 2.0字节9.3
  3. 3CogVideoX-3智谱AI8.8
  4. 4Sora 2OpenAI8.7
  5. 5Veo 2Google8.5
  6. 6Wan2.7-Image阿里8.3
  7. 7Kling 2.0快手8.0
  8. 8Minimax VideoMiniMax7.8
  9. 9Pika 2.0Pika7.5
  10. 10Runway Gen-3Runway7.3
🎨 6. 图片生成与设计
  1. 1DALL-E 4OpenAI9.5
  2. 2Gemini 3.1 Pro (3D生成)Google9.3
  3. 3Wan2.7-Image阿里9.0
  4. 4GLM-Image智谱AI8.8
  5. 5Imagen 3Google8.7
  6. 6Flux 1.1 ProBlackForest8.5
  7. 7Doubao-Image字节8.3
  8. 8Stable Diffusion 3.5Stability8.0
  9. 9文心一格 4.0百度7.8
  10. 10Kling Image快手7.5
💻 7. 代码编程与Debug
  1. 1Claude Opus 4.7Anthropic9.6
  2. 2GPT-5.4OpenAI9.4
  3. 3GPT-5.3 CodexOpenAI9.3
  4. 4Qwen3.6 Plus阿里9.2
  5. 5MiniMax M2.7MiniMax9.0
  6. 6GLM-5.1智谱AI8.9
  7. 7Kimi K2.5月之暗面8.8
  8. 8Llama 4 MaverickMeta8.7
  9. 9Claude Sonnet 4.6Anthropic8.5
  10. 10DeepSeek V3.2DeepSeek8.3
📊 8. 数据分析与报告生成
  1. 1Claude Opus 4.7Anthropic9.4
  2. 2GPT-5.4OpenAI9.3
  3. 3Gemini 3.1 ProGoogle9.0
  4. 4Qwen3.6 Plus阿里8.8
  5. 5文心5.0百度8.7
  6. 6GLM-5智谱AI8.5
  7. 7Kimi K2.5月之暗面8.3
  8. 8Claude Sonnet 4.6Anthropic8.2
  9. 9Doubao-Seed-2.0字节8.0
  10. 10Gemini 2.5 FlashGoogle7.8
🌐 9. 多语言翻译与本地化
  1. 1GPT-5.4OpenAI9.5
  2. 2Claude Opus 4.7Anthropic9.4
  3. 3Gemini 3.1 ProGoogle9.3
  4. 4Qwen3.6 Plus阿里9.0
  5. 5Llama 4 MaverickMeta8.8
  6. 6GLM-5智谱AI8.5
  7. 7Kimi K2.5月之暗面8.3
  8. 8Mistral Medium 3Mistral8.0
  9. 9Doubao-Seed-2.0字节7.8
  10. 10DeepSeek V3.2DeepSeek7.5
🎙️ 10. 语音对话
  1. 1GPT-5.4 (语音模式)OpenAI9.5
  2. 2Gemini 2.5 Flash (实时语音)Google9.3
  3. 3Qwen3.5-Omni阿里9.2
  4. 4GLM-ASR-2512智谱AI9.0
  5. 5Doubao-语音模型字节8.8
  6. 6Kimi 语音助手月之暗面8.5
  7. 7Mistral VoxtralMistral8.3
  8. 8Claude (语音模式)Anthropic8.0
  9. 9Gemma 4 (多模态)Google7.8
  10. 10Le Chat 语音Mistral7.5
🏠 11. 日常通用
  1. 1GPT-5.4OpenAI9.4
  2. 2Claude Sonnet 4.6Anthropic9.2
  3. 3Qwen3.6 Plus阿里9.0
  4. 4Gemini 2.5 FlashGoogle8.8
  5. 5Kimi K2.5月之暗面8.7
  6. 6Doubao-Seed-2.0字节8.5
  7. 7文心4.5百度8.3
  8. 8Llama 4 ScoutMeta8.2
  9. 9DeepSeek V3.2DeepSeek8.0
  10. 10GLM-4.7-Flash智谱AI7.8

📊 AI Model Daily Report · 数据来源: llm-stats.com, LMSYS Arena, Artificial Analysis, Hugging Face

⏰ 更新日期: 2026年4月22日 · 评分基于基准测试数据综合评估

🌐 GitHub · 📧 订阅日报