AI 日报 · 2026-06-02

大模型

NVIDIA GTC台北：Vera Rubin全面量产 + Vera CPU + RTX Spark重构PC

Vera Rubin AI系统全面量产，吞吐量比Grace Blackwell提升10倍 / Vera CPU任务速度比x86快1.8倍，首款专为AI智能体设计的CPU / RTX Spark三合一芯片(CPU+GPU+NPU)台积电3nm / 搭载RTX Spark笔记本今秋由戴尔/联想等品牌上市

黄仁勋从GPU公司变基础架构公司——Vera CPU硬刚Intel，RTX Spark联手微软+联发科重构PC。「算力即收入」不是口号，是英伟达把自己从卖芯片变成卖算力基础设施的战略宣言。

The Verge / IT之家·今日→

微软Build 2026：MAI-Thinking-1首个自研推理模型 + Polaris编程模型

MAI-Thinking-1首个自研推理模型，未用其他模型输出蒸馏训练 / Project Polaris是MoE架构编程模型 / Copilot超级应用含Scout AI agent / Turing Forge企业微调仅需50个训练样本 / MAI-Image-2.5和MAI-Voice-2同期发布

微软做自研模型不是因为OpenAI不够好，是因为4月27日合同重签后OpenAI可上AWS和Google Cloud——Azure不再独家。Polaris的MoE架构跟DeepSeek V4、Kimi K2.6同路，说明MoE已是编程模型事实标准。但SWE-Bench分数没放出来，内部基准不能当终审。

融资

Bloomberg / 财联社·今日→

Alphabet 800亿美元股权融资AI基建，伯克希尔100亿入局

总融资800亿美元（300亿承销+400亿市价发行+100亿伯克希尔私募）/ 伯克希尔以每股351.81/348.20美元分别认购A/C类股 / 2026资本开支上调至1800-1900亿美元 / 2027将显著增加 / 谷歌云收入同比+63% / 积压订单翻倍至4600亿

科技巨头历史上罕见股权融资——说明AI军备竞赛的资本密度已超出现金流+发债的覆盖能力。伯克希尔24小时内敲定100亿，Greg Abel接班后最大单笔押注。AI基建从「技术竞赛」变成「资产负债表竞赛」，谁的融资能力更强谁就能多买几年先发优势。

开源

NVIDIA GTC Taipei·今日→

NVIDIA开源Nemotron 3 Ultra：5500亿参数，推理速度5x，成本降30%

5500亿参数开源模型 / 推理速度比前代快5倍 / 推理成本降低30% / 针对长期运行Agent优化 / 配套企业级Agent Toolkit（OpenShell安全沙盒+NemoClaw编排蓝图）

Nemotron的定位不是做最强通用模型，而是做「Agent的最佳大脑」——推理速度快5倍+成本降30%，瞄准的是Agent 7×24小时运行的场景。开源是手段，让NVIDIA的Agent生态绑定开发者才是目的。

政策

OpenAI 官方博客·今日→

OpenAI与美国能源部签署MOU，AI加速「创世纪使命」科学发现

OpenAI与DOE签署谅解备忘录 / 合作「创世纪使命」(Genesis Mission)汇聚政府+国家实验室+产业界 / 在国家实验室部署前沿模型 / 同日向白宫科技政策办公室提交AI加强科技领导力建议 / OpenAI定义2026为「科学之年」

与DOE的MOU不涉及具体资金，但打开了国家实验室算力和数据的通道。真正的增量不在军事合同，而在科学计算的token化——如果前沿模型能在DOE场景跑通，就是AI for Science最硬的背书。

A G E N T

NVIDIA GTC / 财联社·今日→

英伟达+宇树推出人形机器人Isaac GR00T参考设计，75自由度

宇树H2本体(1.8m/68kg)+Jetson Thor计算平台+Isaac GR00T开放开发平台 / 31个本体自由度+22x2手部自由度=75总自由度 / 五指机械手由Sharpa制造 / Cosmos 3物理世界模型同期发布 / 面向高等教育机构和研究实验室开放

黄仁勋说「身高体重和我差不多」——但意义不在尺寸，在于参考设计。宇树出本体，NVIDIA出计算+模型+仿真，Sharpa出手——这是机器人行业的「公版方案」。降低的不是性能上限，而是实验室入场的下限。

前沿技术

Frontier · GitHub & arXiv 周边

GitHub·本周→

supermemory：AI Agent通用记忆引擎，24K Stars，今日+649

24,040 Stars，今日+649 / 极快、可扩展的内存引擎 / 为AI Agent提供通用记忆API / 支持跨会话持久化记忆 / Agent时代的基础设施层项目

从「无状态聊天」到「有记忆的助手」是Agent最关键的跃迁。supermemory把记忆从每个Agent各自实现变成共享基础设施——类似数据库之于Web应用。Hermes Agent日均处理4580亿Token，靠的就是这种记忆层。

GitHub·本周→

compound-engineering-plugin：跨平台Agent编码插件，19K Stars

19,134 Stars，今日+417 / Compound Engineering官方插件 / 同时支持Claude Code、OpenAI Codex、Cursor三大编码Agent / 提供统一的工程化Agent工作流 / 降低Agent平台锁定风险

一个插件跨三个编码Agent平台——在Agent碎片化时代是反直觉的。但开发者的真实需求就是这样：不想被任何一个平台锁定。它代表的是Agent工具链的「跨平台兼容」方向。

GitHub·本周→

context7：MCP文档服务器，28K Stars，Agent不再用过时API

28,214 Stars / MCP协议服务器 / 为AI编码Agent提供实时库文档注入 / 解决Agent使用过时API的问题 / MCP Servers类别Top 3项目

AI编码Agent最大的隐患不是「不会写代码」，而是「用过时API写代码」。context7通过MCP把最新库文档实时注入Agent上下文——本质是给Agent装了一个永不过时的参考手册。MCP正在成为AI Agent连接外部世界的USB-C接口，context7是最实用的那个插头。