AI 日报 · 2026/06/01

大模型

MiniMax M3 开源：MSA 架构、1M 上下文，SWE-Bench Pro 超 GPT-5.5

自研 MSA 稀疏注意力架构，1M tokens 上下文计算量仅上代 1/20 / MoE 196B 总参数仅激活 11B / SWE-Bench Pro 59.0% 超 GPT-5.5 接近 Opus 4.7 / BrowseComp 83.5 超 Opus 4.7 / 10 天内开源权重

三项能力合一做开源——前沿 Coding、1M 上下文、原生多模态——MiniMax 在"完整前沿能力开放化"上比国内同行激进得多。MSA 不是简单改 KV cache，是从注意力机制底层重写长上下文效率。开源权重才是真牌：能不能在开发者生态跑通，决定了 M3 是模型发布还是生态事件。

Microsoft 官方数据 · 今日 →

GitHub Copilot 已写平台 46% 代码，AI 编程从辅助变默认

Build 2026 前发布数据：GitHub 平台 46% 代码由 Copilot 生成，较 2025 年 11 月的 40% 升 6 个百分点 / 470 万付费用户 / Fortune 500 中 90% 采用 / 6 月 1 日起按 token 计费

46% 不是四舍五入——全球最大代码平台上近半新代码来自 AI。问题已从"该不该用 AI 编程"变成"怎么治理 AI 生成的代码"。计费模式从包月转向按量，既是成本优化也是信号：AI 编程不再是增值功能，是基础设施。

A G E N T

The Information / Reuters · 今日 →

微软自研编程模型 Polaris 亮相 Build 2026，Copilot 不再只靠 OpenAI

MoE 架构专为 Copilot 定制，按语言/框架分专家模块 / 8 月起 470 万用户自动迁移 / 配 Turing Forge 企业微调（VPC 内，50 样本起步）/ Code Content Guarantee 承诺 IP 赔偿 / 4 月 OpenAI 合同重写后微软首次亮牌

OpenAI 合同重写后 46 天，微软就亮出底牌。Polaris 不是追赶 Claude Code，是把 Copilot 从"调用外部模型的产品"变成"自有模型驱动的平台"。MoE 按语言分专家——比通用模型更适合 IDE 场景，但也意味着每个语言子模型的训练数据要够深。Turing Forge 50 样本微调的承诺听起来像营销，但 VPC 内运行是真壁垒。

安全

Anthropic 确认 · 今日 →

Claude Mythos 即将公开发布：首月自主发现 23,019 个关键漏洞

Anthropic 确认 Mythos Preview 数周内公开 / 首月在 Project Glasswing 合作基础设施中发现 23,019 个关键漏洞 / 目前仅限约 50 家组织（AWS、Apple、Google、Microsoft、IBM、Cloudflare、Mozilla）/ 公开发布将首次使自主漏洞发现广泛可用

当每家创业公司、每个开源项目、每个政府机构都能跑同款自动漏洞扫描器，攻防不对称将被彻底改写。23K 漏洞/月是能力证明，也是预警：网络安全从"谁先发现"变成"谁先修补"——而修补永远比发现慢。

融资

21世纪经济报道 · 今日 →

DeepSeek 首轮融资 700 亿：国家大基金领投，投前估值 450 亿美元

国家集成电路产业投资基金领投 DeepSeek 首轮 / 融资规模升至 700 亿元人民币 / 投前估值 450 亿美元 / 国家大基金成立 12 年来首次跨界投资纯大模型公司 / 多家市场化投资机构参与谈判

国家大基金投纯大模型公司——这不是财务投资，是战略定位。DeepSeek 从"杭州创业公司"变成"国家级 AI 战略平台"，信号意义远大于金额本身。但国家队入场也意味着 DeepSeek 的技术路线和开源策略可能面临新的约束。

前沿技术

Frontier · GitHub & arXiv 周边

GitHub · 本周 →

ECC 175.9K Stars：AI 编码 Agent 性能优化系统，覆盖技能/记忆/安全

Agent Harness 全栈优化：Skills（可复用自然语言技能）、Instincts（行为约束）、Memory（持久上下文）、Security（安全审计）/ 支持 Claude Code、Codex、Cursor、Gemini CLI 等 14+ 平台 / 175.9K Stars / 研究优先开发方法论

Agent 不缺框架，缺的是"怎么让 Agent 稳定跑在生产环境"。ECC 把 Skills、Memory、Security 做成统一 Harness——本质上是给 Agent 加了一套操作系统级的进程管理。175K Stars 说明开发者对"让 Agent 不闯祸"的需求远比"让 Agent 更聪明"迫切。

GitHub · 本周 →

context-mode 13.6K Stars：MCP 上下文窗口优化，Token 消耗降 98%

MCP Server 实现 / 沙箱化工具输出，上下文窗口 Token 消耗降低 98% / 支持 Claude Code、Codex、Cursor 等 14 个平台 / 13.6K Stars / TypeScript 实现

MCP 协议解决了"Agent 怎么连外部工具"，context-mode 解决的是"连完之后 Token 爆了怎么办"。98% 压缩意味着原来跑 1 次的 Token 预算现在能跑 50 次——这比模型降价更直接地降低了 Agent 的运行成本。

GitHub · 本周 →

code-review-graph 15.9K Stars：本地代码知识图谱，Code Review Token 降 6.8 倍

基于 Tree-sitter 构建本地代码知识图谱 / Claude Code 代码审查 Token 消耗降 6.8 倍 / 日常编码任务 Token 降最高 49 倍 / 增量索引 / 15.9K Stars / Python 实现

GraphRAG 从通用搜索搬进了 IDE——用知识图谱给 Claude Code 做"预习"，让它只读真正相关的代码而非整仓暴力灌入。增量索引是关键：代码库天天变，图谱必须跟着变。6.8 倍不是极限，49 倍才是——后者意味着某些场景下 Agent 的上下文效率接近了人类"只看 diff"的水平。