AI 日报 · 2026/06/08

A G E N T

Apple WWDC 2026：Siri 独立应用 + Gemini 底座 + 第三方 AI 切换

Siri 首次成为独立应用 / Google Gemini 作为底层基础模型 / 用户可在 ChatGPT、Claude、Gemini 间自由切换 / Core AI 框架开放第三方开发者扩展 / 覆盖 20 亿+ Apple 设备 / 库克卸任前最后一次 WWDC

苹果的 AI 策略终于从"自己做"转向"做平台"——复刻 App Store 逻辑：掌握分发权，让模型厂商在 iOS 上竞争。对 Claude 和 Gemini 而言，这是零安装成本直达 20 亿用户的渠道。但苹果做平台的前提是自身有足够控制力，两年 Apple Intelligence 的迟滞说明这条路并不稳。

金融时报 / 路透社 · 今日 →

OpenAI「聊天已死」：ChatGPT 史上最大改版，Codex 整体并入

ChatGPT 将升级为集成编程+AI 代理+图像生成+第三方应用的「超级应用」/ Codex 周活从不到 100 万增至 500 万（6 倍）/ 企业客户贡献 40% 收入，预计年底升至 50% / 内部已有人说「聊天已死」/ 知识工作者占 Codex 用户约 20%

OpenAI 不是在改版，是在补课。ChatGPT 三年积累的近 10 亿用户免费为主，而 Anthropic 靠 Claude Code 跑出 25 亿美元年化收入。从「技术叙事」转向「商业兑现」——IPO 前必须证明 AI 不只是聊天工具，而是可持续付费的生产力系统。

大模型

NVIDIA 官方 / 每经 · 今日 →

NVIDIA + SK 海力士多年合作：共同开发 Vera Rubin 下一代 AI 内存

多年期技术合作 / SK 海力士为 Vera Rubin、Vera CPU、RTX Spark、Jetson Thor 协同开发专用内存 / 采用 CUDA-X + PhysicsNeMo 加速芯片仿真 / 用 Omniverse 构建晶圆厂数字孪生 / 三星/美光 HBM4 已通过认证进入量产

黄仁勋锁定三大存储供应商保障 Vera Rubin 供货，同时把 NVIDIA 软件栈嵌入 SK 海力士制造流程——不只是买内存，是在重塑内存厂商的研发方式。AI 工厂是下一轮工业革命的引擎，先进内存是引擎的燃料。

港交所公告 · 今日 →

云知声发布 U2 大模型：2660 亿参数 MoE，原生 Agent 驱动

2660 亿参数 / 快慢思考融合 MoE 架构 / 首创原生推理路径蒸馏技术 / 混合思考模式 + Harness 同步训练降低 Token 消耗 / 原生 Agent 驱动：全栈开发+智能编排+深度推理一体化 / 指令遵循/长上下文/科学推理/软件工程智能体对标全球顶尖

港股上市公司做大模型，参数量 2660 亿不算最大，但「原生 Agent 驱动」的定位很准——不是先做通用模型再套 Agent 壳，而是从架构层面为 Agent 任务优化。推理路径蒸馏是亮点：让模型自己学会拆解任务，而不是靠外部编排。

融资

TechCrunch / 每经 · 今日 →

SpaceX 算力帝国：谷歌 + Anthropic 合计超 700 亿美元

Google 月付 9.2 亿美元租约 11 万 GPU（2026.10—2029.6）/ Anthropic 月付 12.5 亿美元 / SpaceX 月入 21.7 亿美元 / 年化约 260 亿美元 / 合同总额超 700 亿美元 / SpaceX 6 月 12 日 IPO 目标融资 750 亿美元

SpaceX 的算力租赁业务已经比火箭发射更赚钱。两份月租协议 = 260 亿美元年化收入，直接支撑 750 亿美元 IPO 叙事。算力正在成为比卫星更值钱的基础设施——SpaceX 卖的不是发射服务，是 AI 时代的「电站」。

前沿技术

Frontier · GitHub & arXiv 周边

arXiv · Google Research · 本周 →

LEAP：Google agentic 框架解全部 Putnam 2025 题，形式证明率＜10%→70%

Google Research 出品 / agentic 框架让通用 LLM 做形式化数学证明 / 2025 Putnam 竞赛 12 题全部解出 / Lean-IMO-Bench one-shot 从＜10% 提升到 70% / 超越专门 IMO 金牌系统 48% 基准 / 自主形式化 Knuth 哈密顿分解开放问题

LEAP 的突破不在「AI 做数学」本身，而在让通用模型通过 agentic 框架达到专用系统水平。从＜10% 到 70% 的形式化证明率，本质是 agent 循环与 Lean 编译器深度耦合。Putnam 全解是里程碑，但更值得看的是 Knuth 开放问题的形式化——AI 从「解题」进入「研究」。

GitHub · 今日 →

turbovec：Rust 向量索引引擎，7.2K Stars 日增 1,554

基于 TurboQuant 构建的向量索引 / Rust 编写 + Python 绑定 / GitHub Trending 日增 1,554 Stars / 总计 7,282 Stars / 面向大规模检索场景的内存+速度优化

向量检索是大模型推理链路的瓶颈环节——embedding 生成再快，检索跟不上也是白搭。turbovec 用 Rust 重写索引层，日增 1,500+ Stars 说明开发者对「更快更省内存的向量搜索」有真实需求。TurboQuant 算法 + Rust 性能，直接对标 FAISS 的 Python/C++ 老架构。

GitHub · 今日 →

agent-gate：MCP 质量门控服务器，防篡改收据 + fail-closed 检查

MCP server 让 Agent 声明「完成」前必须通过验证 / fail-closed 检查清单 / SHA256 链式防篡改收据 / 默认 ship gate 含 5 项检查（确定性验证/独立反驳/无密钥/人工审批/收据记录）/ MIT 许可 / 17 个测试用例

Agent 系统最贵的失败不是慢，是「悄悄出错」——agent 说完成了但实际做错了。agent-gate 把「自评」变成「必须通过的检查门」，收据链式哈希确保审计可追溯。这是 MCP 生态从「连接工具」走向「质量控制」的信号。