VOL · 12

把今天的 AI
一杯咖啡读完

每日精选 · 一手源优先 · 看见 AI 浪潮的真实方向

2026 / 06 / 02 · 周一

大 模 型
NVIDIA GTC台北:Vera Ru
NVIDIA GTC Taipei·今日

NVIDIA GTC台北:Vera Rubin全面量产 + Vera CPU + RTX Spark重构PC

Vera Rubin AI系统全面量产,吞吐量比Grace Blackwell提升10倍 / Vera CPU任务速度比x86快1.8倍,首款专为AI智能体设计的CPU / RTX Spark三合一芯片(CPU+GPU+NPU)台积电3nm / 搭载RTX Spark笔记本今秋由戴尔/联想等品牌上市

黄仁勋从GPU公司变基础架构公司——Vera CPU硬刚Intel,RTX Spark联手微软+联发科重构PC。「算力即收入」不是口号,是英伟达把自己从卖芯片变成卖算力基础设施的战略宣言。
微软Build 2026:MAI-Thi
The Verge / IT之家·今日

微软Build 2026:MAI-Thinking-1首个自研推理模型 + Polaris编程模型

MAI-Thinking-1首个自研推理模型,未用其他模型输出蒸馏训练 / Project Polaris是MoE架构编程模型 / Copilot超级应用含Scout AI agent / Turing Forge企业微调仅需50个训练样本 / MAI-Image-2.5和MAI-Voice-2同期发布

微软做自研模型不是因为OpenAI不够好,是因为4月27日合同重签后OpenAI可上AWS和Google Cloud——Azure不再独家。Polaris的MoE架构跟DeepSeek V4、Kimi K2.6同路,说明MoE已是编程模型事实标准。但SWE-Bench分数没放出来,内部基准不能当终审。
融 资
Alphabet 800亿美元股权融资A
Bloomberg / 财联社·今日

Alphabet 800亿美元股权融资AI基建,伯克希尔100亿入局

总融资800亿美元(300亿承销+400亿市价发行+100亿伯克希尔私募)/ 伯克希尔以每股351.81/348.20美元分别认购A/C类股 / 2026资本开支上调至1800-1900亿美元 / 2027将显著增加 / 谷歌云收入同比+63% / 积压订单翻倍至4600亿

科技巨头历史上罕见股权融资——说明AI军备竞赛的资本密度已超出现金流+发债的覆盖能力。伯克希尔24小时内敲定100亿,Greg Abel接班后最大单笔押注。AI基建从「技术竞赛」变成「资产负债表竞赛」,谁的融资能力更强谁就能多买几年先发优势。
开 源
NVIDIA开源Nemotron 3 U
NVIDIA GTC Taipei·今日

NVIDIA开源Nemotron 3 Ultra:5500亿参数,推理速度5x,成本降30%

5500亿参数开源模型 / 推理速度比前代快5倍 / 推理成本降低30% / 针对长期运行Agent优化 / 配套企业级Agent Toolkit(OpenShell安全沙盒+NemoClaw编排蓝图)

Nemotron的定位不是做最强通用模型,而是做「Agent的最佳大脑」——推理速度快5倍+成本降30%,瞄准的是Agent 7×24小时运行的场景。开源是手段,让NVIDIA的Agent生态绑定开发者才是目的。
政 策
OpenAI 官方博客·今日

OpenAI与美国能源部签署MOU,AI加速「创世纪使命」科学发现

OpenAI与DOE签署谅解备忘录 / 合作「创世纪使命」(Genesis Mission)汇聚政府+国家实验室+产业界 / 在国家实验室部署前沿模型 / 同日向白宫科技政策办公室提交AI加强科技领导力建议 / OpenAI定义2026为「科学之年」

与DOE的MOU不涉及具体资金,但打开了国家实验室算力和数据的通道。真正的增量不在军事合同,而在科学计算的token化——如果前沿模型能在DOE场景跑通,就是AI for Science最硬的背书。
A G E N T
英伟达+宇树推出人形机器人Isaac G
NVIDIA GTC / 财联社·今日

英伟达+宇树推出人形机器人Isaac GR00T参考设计,75自由度

宇树H2本体(1.8m/68kg)+Jetson Thor计算平台+Isaac GR00T开放开发平台 / 31个本体自由度+22x2手部自由度=75总自由度 / 五指机械手由Sharpa制造 / Cosmos 3物理世界模型同期发布 / 面向高等教育机构和研究实验室开放

黄仁勋说「身高体重和我差不多」——但意义不在尺寸,在于参考设计。宇树出本体,NVIDIA出计算+模型+仿真,Sharpa出手——这是机器人行业的「公版方案」。降低的不是性能上限,而是实验室入场的下限。
前 沿 技 术

Frontier · GitHub & arXiv 周边

supermemory:AI Agent
GitHub·本周

supermemory:AI Agent通用记忆引擎,24K Stars,今日+649

24,040 Stars,今日+649 / 极快、可扩展的内存引擎 / 为AI Agent提供通用记忆API / 支持跨会话持久化记忆 / Agent时代的基础设施层项目

从「无状态聊天」到「有记忆的助手」是Agent最关键的跃迁。supermemory把记忆从每个Agent各自实现变成共享基础设施——类似数据库之于Web应用。Hermes Agent日均处理4580亿Token,靠的就是这种记忆层。
compound-engineering
GitHub·本周

compound-engineering-plugin:跨平台Agent编码插件,19K Stars

19,134 Stars,今日+417 / Compound Engineering官方插件 / 同时支持Claude Code、OpenAI Codex、Cursor三大编码Agent / 提供统一的工程化Agent工作流 / 降低Agent平台锁定风险

一个插件跨三个编码Agent平台——在Agent碎片化时代是反直觉的。但开发者的真实需求就是这样:不想被任何一个平台锁定。它代表的是Agent工具链的「跨平台兼容」方向。
context7:MCP文档服务器,28
GitHub·本周

context7:MCP文档服务器,28K Stars,Agent不再用过时API

28,214 Stars / MCP协议服务器 / 为AI编码Agent提供实时库文档注入 / 解决Agent使用过时API的问题 / MCP Servers类别Top 3项目

AI编码Agent最大的隐患不是「不会写代码」,而是「用过时API写代码」。context7通过MCP把最新库文档实时注入Agent上下文——本质是给Agent装了一个永不过时的参考手册。MCP正在成为AI Agent连接外部世界的USB-C接口,context7是最实用的那个插头。