VOL · 11

把今天的 AI
一杯咖啡读完

每日精选 · 一手源优先 · 看见 AI 浪潮的真实方向

2026 / 06 / 01 · 周日

大 模 型
MiniMax M3
IT之家 / MiniMax 官方 · 今日

MiniMax M3 开源:MSA 架构、1M 上下文,SWE-Bench Pro 超 GPT-5.5

自研 MSA 稀疏注意力架构,1M tokens 上下文计算量仅上代 1/20 / MoE 196B 总参数仅激活 11B / SWE-Bench Pro 59.0% 超 GPT-5.5 接近 Opus 4.7 / BrowseComp 83.5 超 Opus 4.7 / 10 天内开源权重

三项能力合一做开源——前沿 Coding、1M 上下文、原生多模态——MiniMax 在"完整前沿能力开放化"上比国内同行激进得多。MSA 不是简单改 KV cache,是从注意力机制底层重写长上下文效率。开源权重才是真牌:能不能在开发者生态跑通,决定了 M3 是模型发布还是生态事件。
GitHub Copilot 46%
Microsoft 官方数据 · 今日

GitHub Copilot 已写平台 46% 代码,AI 编程从辅助变默认

Build 2026 前发布数据:GitHub 平台 46% 代码由 Copilot 生成,较 2025 年 11 月的 40% 升 6 个百分点 / 470 万付费用户 / Fortune 500 中 90% 采用 / 6 月 1 日起按 token 计费

46% 不是四舍五入——全球最大代码平台上近半新代码来自 AI。问题已从"该不该用 AI 编程"变成"怎么治理 AI 生成的代码"。计费模式从包月转向按量,既是成本优化也是信号:AI 编程不再是增值功能,是基础设施。
A G E N T
Microsoft Polaris
The Information / Reuters · 今日

微软自研编程模型 Polaris 亮相 Build 2026,Copilot 不再只靠 OpenAI

MoE 架构专为 Copilot 定制,按语言/框架分专家模块 / 8 月起 470 万用户自动迁移 / 配 Turing Forge 企业微调(VPC 内,50 样本起步)/ Code Content Guarantee 承诺 IP 赔偿 / 4 月 OpenAI 合同重写后微软首次亮牌

OpenAI 合同重写后 46 天,微软就亮出底牌。Polaris 不是追赶 Claude Code,是把 Copilot 从"调用外部模型的产品"变成"自有模型驱动的平台"。MoE 按语言分专家——比通用模型更适合 IDE 场景,但也意味着每个语言子模型的训练数据要够深。Turing Forge 50 样本微调的承诺听起来像营销,但 VPC 内运行是真壁垒。
安 全
Anthropic 确认 · 今日

Claude Mythos 即将公开发布:首月自主发现 23,019 个关键漏洞

Anthropic 确认 Mythos Preview 数周内公开 / 首月在 Project Glasswing 合作基础设施中发现 23,019 个关键漏洞 / 目前仅限约 50 家组织(AWS、Apple、Google、Microsoft、IBM、Cloudflare、Mozilla)/ 公开发布将首次使自主漏洞发现广泛可用

当每家创业公司、每个开源项目、每个政府机构都能跑同款自动漏洞扫描器,攻防不对称将被彻底改写。23K 漏洞/月是能力证明,也是预警:网络安全从"谁先发现"变成"谁先修补"——而修补永远比发现慢。
融 资
21世纪经济报道 · 今日

DeepSeek 首轮融资 700 亿:国家大基金领投,投前估值 450 亿美元

国家集成电路产业投资基金领投 DeepSeek 首轮 / 融资规模升至 700 亿元人民币 / 投前估值 450 亿美元 / 国家大基金成立 12 年来首次跨界投资纯大模型公司 / 多家市场化投资机构参与谈判

国家大基金投纯大模型公司——这不是财务投资,是战略定位。DeepSeek 从"杭州创业公司"变成"国家级 AI 战略平台",信号意义远大于金额本身。但国家队入场也意味着 DeepSeek 的技术路线和开源策略可能面临新的约束。
前 沿 技 术

Frontier · GitHub & arXiv 周边

ECC
GitHub · 本周

ECC 175.9K Stars:AI 编码 Agent 性能优化系统,覆盖技能/记忆/安全

Agent Harness 全栈优化:Skills(可复用自然语言技能)、Instincts(行为约束)、Memory(持久上下文)、Security(安全审计)/ 支持 Claude Code、Codex、Cursor、Gemini CLI 等 14+ 平台 / 175.9K Stars / 研究优先开发方法论

Agent 不缺框架,缺的是"怎么让 Agent 稳定跑在生产环境"。ECC 把 Skills、Memory、Security 做成统一 Harness——本质上是给 Agent 加了一套操作系统级的进程管理。175K Stars 说明开发者对"让 Agent 不闯祸"的需求远比"让 Agent 更聪明"迫切。
context-mode
GitHub · 本周

context-mode 13.6K Stars:MCP 上下文窗口优化,Token 消耗降 98%

MCP Server 实现 / 沙箱化工具输出,上下文窗口 Token 消耗降低 98% / 支持 Claude Code、Codex、Cursor 等 14 个平台 / 13.6K Stars / TypeScript 实现

MCP 协议解决了"Agent 怎么连外部工具",context-mode 解决的是"连完之后 Token 爆了怎么办"。98% 压缩意味着原来跑 1 次的 Token 预算现在能跑 50 次——这比模型降价更直接地降低了 Agent 的运行成本。
code-review-graph
GitHub · 本周

code-review-graph 15.9K Stars:本地代码知识图谱,Code Review Token 降 6.8 倍

基于 Tree-sitter 构建本地代码知识图谱 / Claude Code 代码审查 Token 消耗降 6.8 倍 / 日常编码任务 Token 降最高 49 倍 / 增量索引 / 15.9K Stars / Python 实现

GraphRAG 从通用搜索搬进了 IDE——用知识图谱给 Claude Code 做"预习",让它只读真正相关的代码而非整仓暴力灌入。增量索引是关键:代码库天天变,图谱必须跟着变。6.8 倍不是极限,49 倍才是——后者意味着某些场景下 Agent 的上下文效率接近了人类"只看 diff"的水平。