VOL · 16

把今天的 AI
一杯咖啡读完

每日精选 · 一手源优先 · 看见 AI 浪潮的真实方向

2026 / 06 / 08 · 周一

A G E N T
Bloomberg / 科创板日报 · 今日

Apple WWDC 2026:Siri 独立应用 + Gemini 底座 + 第三方 AI 切换

Siri 首次成为独立应用 / Google Gemini 作为底层基础模型 / 用户可在 ChatGPT、Claude、Gemini 间自由切换 / Core AI 框架开放第三方开发者扩展 / 覆盖 20 亿+ Apple 设备 / 库克卸任前最后一次 WWDC

苹果的 AI 策略终于从"自己做"转向"做平台"——复刻 App Store 逻辑:掌握分发权,让模型厂商在 iOS 上竞争。对 Claude 和 Gemini 而言,这是零安装成本直达 20 亿用户的渠道。但苹果做平台的前提是自身有足够控制力,两年 Apple Intelligence 的迟滞说明这条路并不稳。
ChatGPT
金融时报 / 路透社 · 今日

OpenAI「聊天已死」:ChatGPT 史上最大改版,Codex 整体并入

ChatGPT 将升级为集成编程+AI 代理+图像生成+第三方应用的「超级应用」/ Codex 周活从不到 100 万增至 500 万(6 倍)/ 企业客户贡献 40% 收入,预计年底升至 50% / 内部已有人说「聊天已死」/ 知识工作者占 Codex 用户约 20%

OpenAI 不是在改版,是在补课。ChatGPT 三年积累的近 10 亿用户免费为主,而 Anthropic 靠 Claude Code 跑出 25 亿美元年化收入。从「技术叙事」转向「商业兑现」——IPO 前必须证明 AI 不只是聊天工具,而是可持续付费的生产力系统。
大 模 型
NVIDIA SK Hynix
NVIDIA 官方 / 每经 · 今日

NVIDIA + SK 海力士多年合作:共同开发 Vera Rubin 下一代 AI 内存

多年期技术合作 / SK 海力士为 Vera Rubin、Vera CPU、RTX Spark、Jetson Thor 协同开发专用内存 / 采用 CUDA-X + PhysicsNeMo 加速芯片仿真 / 用 Omniverse 构建晶圆厂数字孪生 / 三星/美光 HBM4 已通过认证进入量产

黄仁勋锁定三大存储供应商保障 Vera Rubin 供货,同时把 NVIDIA 软件栈嵌入 SK 海力士制造流程——不只是买内存,是在重塑内存厂商的研发方式。AI 工厂是下一轮工业革命的引擎,先进内存是引擎的燃料。
港交所公告 · 今日

云知声发布 U2 大模型:2660 亿参数 MoE,原生 Agent 驱动

2660 亿参数 / 快慢思考融合 MoE 架构 / 首创原生推理路径蒸馏技术 / 混合思考模式 + Harness 同步训练降低 Token 消耗 / 原生 Agent 驱动:全栈开发+智能编排+深度推理一体化 / 指令遵循/长上下文/科学推理/软件工程智能体对标全球顶尖

港股上市公司做大模型,参数量 2660 亿不算最大,但「原生 Agent 驱动」的定位很准——不是先做通用模型再套 Agent 壳,而是从架构层面为 Agent 任务优化。推理路径蒸馏是亮点:让模型自己学会拆解任务,而不是靠外部编排。
融 资
SpaceX
TechCrunch / 每经 · 今日

SpaceX 算力帝国:谷歌 + Anthropic 合计超 700 亿美元

Google 月付 9.2 亿美元租约 11 万 GPU(2026.10—2029.6)/ Anthropic 月付 12.5 亿美元 / SpaceX 月入 21.7 亿美元 / 年化约 260 亿美元 / 合同总额超 700 亿美元 / SpaceX 6 月 12 日 IPO 目标融资 750 亿美元

SpaceX 的算力租赁业务已经比火箭发射更赚钱。两份月租协议 = 260 亿美元年化收入,直接支撑 750 亿美元 IPO 叙事。算力正在成为比卫星更值钱的基础设施——SpaceX 卖的不是发射服务,是 AI 时代的「电站」。
前 沿 技 术

Frontier · GitHub & arXiv 周边

arXiv · Google Research · 本周

LEAP:Google agentic 框架解全部 Putnam 2025 题,形式证明率<10%→70%

Google Research 出品 / agentic 框架让通用 LLM 做形式化数学证明 / 2025 Putnam 竞赛 12 题全部解出 / Lean-IMO-Bench one-shot 从<10% 提升到 70% / 超越专门 IMO 金牌系统 48% 基准 / 自主形式化 Knuth 哈密顿分解开放问题

LEAP 的突破不在「AI 做数学」本身,而在让通用模型通过 agentic 框架达到专用系统水平。从<10% 到 70% 的形式化证明率,本质是 agent 循环与 Lean 编译器深度耦合。Putnam 全解是里程碑,但更值得看的是 Knuth 开放问题的形式化——AI 从「解题」进入「研究」。
turbovec
GitHub · 今日

turbovec:Rust 向量索引引擎,7.2K Stars 日增 1,554

基于 TurboQuant 构建的向量索引 / Rust 编写 + Python 绑定 / GitHub Trending 日增 1,554 Stars / 总计 7,282 Stars / 面向大规模检索场景的内存+速度优化

向量检索是大模型推理链路的瓶颈环节——embedding 生成再快,检索跟不上也是白搭。turbovec 用 Rust 重写索引层,日增 1,500+ Stars 说明开发者对「更快更省内存的向量搜索」有真实需求。TurboQuant 算法 + Rust 性能,直接对标 FAISS 的 Python/C++ 老架构。
agent-gate
GitHub · 今日

agent-gate:MCP 质量门控服务器,防篡改收据 + fail-closed 检查

MCP server 让 Agent 声明「完成」前必须通过验证 / fail-closed 检查清单 / SHA256 链式防篡改收据 / 默认 ship gate 含 5 项检查(确定性验证/独立反驳/无密钥/人工审批/收据记录)/ MIT 许可 / 17 个测试用例

Agent 系统最贵的失败不是慢,是「悄悄出错」——agent 说完成了但实际做错了。agent-gate 把「自评」变成「必须通过的检查门」,收据链式哈希确保审计可追溯。这是 MCP 生态从「连接工具」走向「质量控制」的信号。