📢 今日简报
🆕 新模型 / 版本
🔹
Claude Opus 4.7(4.16) - SWE-bench 87.6%,视觉能力3倍提升,指令执行近乎零偏差
🔹
Qwen3.6-35B-A3B(4.16) - 开源MoE模型,30亿激活参数逼近顶级闭源模型
🔹
GLM-5.1(4.08) - 智谱开源旗舰,独立工作8小时
📊 评分速览 TOP 5
🥇
Claude Opus 4.7 - 综合评分 9.2 | 编程/推理双冠王
🥈
GPT-5.4 - 综合评分 9.0 | 原生计算机使用、多模态领先
🥉
Gemini 3.1 Pro - 综合评分 8.8 | MMMU-Pro 多模态冠军
4️⃣
Qwen3.6 Plus - 综合评分 8.5 | 性价比之王
5️⃣
GLM-5.1 - 综合评分 8.4 | 国产开源第一
🔄 场景排名变动
📈
Claude Opus 4.7 在编程/Debug场景超越 GPT-5.4
📈
MiniMax M2.7 开源后跻身软件工程TOP 5
📈
Kimi K2.5 Agent Swarm 模式在长程任务场景爆发
📌 今日一句话总结
Claude Opus 4.7 以 87.6% SWE-bench 刷新编程基准记录,GPT-6 即将于4月14日发布,中国大模型周调用量连续五周超越美国4.27倍,AI竞争进入新纪元。
🔥 今日热点动态
GPT-6 官宣4月14日发布
OpenAI宣布代号"Spud"的新一代旗舰模型,参数量5-6万亿(MoE架构),支持200万Token上下文,代码/推理/智能体任务性能较GPT-5.4提升约40%。
📅 4月9日官宣
中国大模型周调用量超越美国4.27倍
根据OpenRouter数据,中国AI大模型周调用量突破12.96万亿Token,环比暴涨31.48%,连续第五周超越美国。阿里Qwen3.6 Plus以4.6万亿Token登顶全球榜首。
📅 4月6日数据
MiniMax M2.7 全球开源
MiniMax正式全球开源其首个具备自我进化能力的大模型M2.7。开源首日华为昇腾、NVIDIA等完成0 Day接入适配。SWE-Pro测试56.22%正确率追平GPT-5.3-Codex。
📅 4月12日
DeepSeek 启动首次外部融资
据报道DeepSeek正与投资者洽谈首轮外部股权融资,目标估值不低于100亿美元,募集不少于3亿美元。公司已沉默5个月未发布新模型。
📅 4月18日
📊 五维评分榜
评分说明:每项1-10分 | ①领域知识深度 ②任务专项能力 ③交互与可控性 ④成本与效率 ⑤生态与部署
| 模型 | ①知识深度 | ②专项能力 | ③交互可控 | ④成本效率 | ⑤生态部署 | 综合 |
|---|---|---|---|---|---|---|
|
Claude Opus 4.7
Anthropic
|
9.5
|
9.5
|
9.3
|
7.0
|
9.0
|
9.2 |
|
GPT-5.4 Pro
OpenAI
|
9.3
|
9.2
|
9.0
|
8.0
|
9.5
|
9.0 |
|
Gemini 3.1 Pro
Google
|
9.2
|
9.0
|
8.5
|
8.5
|
9.0
|
8.8 |
|
Qwen3.6 Plus
阿里
|
8.5
|
9.0
|
8.5
|
9.5
|
8.5
|
8.5 |
|
GLM-5.1
智谱AI
|
8.3
|
8.8
|
8.3
|
8.8
|
8.0
|
8.4 |
|
Kimi K2.5
月之暗面
|
8.3
|
8.8
|
8.5
|
8.5
|
7.8
|
8.3 |
|
Llama 4 Maverick
Meta
|
8.0
|
8.3
|
8.0
|
9.0
|
9.3
|
8.3 |
|
MiniMax M2.7
MiniMax
|
7.8
|
8.5
|
8.0
|
8.8
|
7.5
|
8.1 |
|
DeepSeek V3.2
DeepSeek
|
8.0
|
8.3
|
8.0
|
9.5
|
7.5
|
8.0 |
|
Claude Sonnet 4.6
Anthropic
|
8.5
|
8.3
|
8.8
|
7.8
|
8.5
|
8.2 |
|
Grok 4.20
xAI
|
8.0
|
8.0
|
7.8
|
8.0
|
7.0
|
7.8 |
|
文心5.0
百度
|
8.0
|
8.0
|
7.8
|
8.5
|
7.5
|
7.8 |
|
Doubao-Seed-2.0
字节
|
7.5
|
8.0
|
8.0
|
9.0
|
7.0
|
7.7 |
|
Mistral Medium 3
Mistral
|
7.5
|
7.8
|
7.8
|
8.0
|
7.3
|
7.6 |
🏆 场景TOP 10 排名
📄 1. 多文件信息提取
- 1Gemini 3.1 ProGoogle9.4
- 2Claude Opus 4.7Anthropic9.3
- 3GPT-5.4OpenAI9.2
- 4Kimi K2.5月之暗面9.0
- 5Qwen3.6 Plus阿里8.8
- 6GLM-5.1智谱AI8.7
- 7文心5.0百度8.5
- 8Llama 4 ScoutMeta8.3
- 9Doubao-Seed-2.0字节8.0
- 10Gemini 2.5 FlashGoogle7.8
⚖️ 2. 文件内容对比
- 1Claude Opus 4.7Anthropic9.5
- 2GPT-5.4OpenAI9.3
- 3Gemini 3.1 ProGoogle9.2
- 4Qwen3.6 Plus阿里8.9
- 5GLM-5.1智谱AI8.8
- 6Kimi K2.5月之暗面8.7
- 7Claude Sonnet 4.6Anthropic8.5
- 8文心5.0百度8.3
- 9DeepSeek V3.2DeepSeek8.0
- 10Doubao-Seed-2.0字节7.8
✍️ 3. 创意写作与内容生成
- 1GPT-5.4OpenAI9.5
- 2Claude Opus 4.7Anthropic9.3
- 3Qwen3.6 Plus阿里9.0
- 4Gemini 3.1 ProGoogle8.8
- 5GLM-5智谱AI8.7
- 6Kimi K2.5月之暗面8.6
- 7文心5.0百度8.5
- 8Muse SparkMeta8.4
- 9Claude Sonnet 4.6Anthropic8.3
- 10Doubao-Seed-2.0字节8.0
🎬 4. 视频脚本与分镜策划
- 1GPT-5.4OpenAI9.3
- 2Qwen3.5-Omni阿里9.2
- 3Gemini 3.1 ProGoogle9.0
- 4Kimi K2.5月之暗面8.8
- 5Claude Opus 4.7Anthropic8.7
- 6GLM-5V-Turbo智谱AI8.5
- 7Doubao-Seed-2.0字节8.3
- 8文心5.0百度8.0
- 9Llama 4 MaverickMeta7.8
- 10Gemma 4 31BGoogle7.5
🎥 5. 视频生成与制作
- 1HappyHorse-1.0阿里9.5
- 2Seedance 2.0字节9.3
- 3CogVideoX-3智谱AI8.8
- 4Sora 2OpenAI8.7
- 5Veo 2Google8.5
- 6Wan2.7-Image阿里8.3
- 7Kling 2.0快手8.0
- 8Minimax VideoMiniMax7.8
- 9Pika 2.0Pika7.5
- 10Runway Gen-3Runway7.3
🎨 6. 图片生成与设计
- 1DALL-E 4OpenAI9.5
- 2Gemini 3.1 Pro (3D生成)Google9.3
- 3Wan2.7-Image阿里9.0
- 4GLM-Image智谱AI8.8
- 5Imagen 3Google8.7
- 6Flux 1.1 ProBlackForest8.5
- 7Doubao-Image字节8.3
- 8Stable Diffusion 3.5Stability8.0
- 9文心一格 4.0百度7.8
- 10Kling Image快手7.5
💻 7. 代码编程与Debug
- 1Claude Opus 4.7Anthropic9.6
- 2GPT-5.4OpenAI9.4
- 3GPT-5.3 CodexOpenAI9.3
- 4Qwen3.6 Plus阿里9.2
- 5MiniMax M2.7MiniMax9.0
- 6GLM-5.1智谱AI8.9
- 7Kimi K2.5月之暗面8.8
- 8Llama 4 MaverickMeta8.7
- 9Claude Sonnet 4.6Anthropic8.5
- 10DeepSeek V3.2DeepSeek8.3
📊 8. 数据分析与报告生成
- 1Claude Opus 4.7Anthropic9.4
- 2GPT-5.4OpenAI9.3
- 3Gemini 3.1 ProGoogle9.0
- 4Qwen3.6 Plus阿里8.8
- 5文心5.0百度8.7
- 6GLM-5智谱AI8.5
- 7Kimi K2.5月之暗面8.3
- 8Claude Sonnet 4.6Anthropic8.2
- 9Doubao-Seed-2.0字节8.0
- 10Gemini 2.5 FlashGoogle7.8
🌐 9. 多语言翻译与本地化
- 1GPT-5.4OpenAI9.5
- 2Claude Opus 4.7Anthropic9.4
- 3Gemini 3.1 ProGoogle9.3
- 4Qwen3.6 Plus阿里9.0
- 5Llama 4 MaverickMeta8.8
- 6GLM-5智谱AI8.5
- 7Kimi K2.5月之暗面8.3
- 8Mistral Medium 3Mistral8.0
- 9Doubao-Seed-2.0字节7.8
- 10DeepSeek V3.2DeepSeek7.5
🎙️ 10. 语音对话
- 1GPT-5.4 (语音模式)OpenAI9.5
- 2Gemini 2.5 Flash (实时语音)Google9.3
- 3Qwen3.5-Omni阿里9.2
- 4GLM-ASR-2512智谱AI9.0
- 5Doubao-语音模型字节8.8
- 6Kimi 语音助手月之暗面8.5
- 7Mistral VoxtralMistral8.3
- 8Claude (语音模式)Anthropic8.0
- 9Gemma 4 (多模态)Google7.8
- 10Le Chat 语音Mistral7.5
🏠 11. 日常通用
- 1GPT-5.4OpenAI9.4
- 2Claude Sonnet 4.6Anthropic9.2
- 3Qwen3.6 Plus阿里9.0
- 4Gemini 2.5 FlashGoogle8.8
- 5Kimi K2.5月之暗面8.7
- 6Doubao-Seed-2.0字节8.5
- 7文心4.5百度8.3
- 8Llama 4 ScoutMeta8.2
- 9DeepSeek V3.2DeepSeek8.0
- 10GLM-4.7-Flash智谱AI7.8