VOL · 20

把今天的 AI
一杯咖啡读完

每日精选 · 一手源优先 · 看见 AI 浪潮的真实方向

2026 / 06 / 12 · 周五

融 资
SpaceX IPO
财联社 / Reuters · 今日

SpaceX 今日登陆纳斯达克,$750 亿募资创史上最大 IPO

$135/股 / 5.556 亿股 / 募资 $750 亿 / 完全稀释估值 $1.77 万亿 / 贝莱德认购超 $50 亿 / 散户认购超 $700 亿 / 4 倍超额认购 / 2025 年营收 $187 亿 +33% / Starlink + 算力租赁年化收入 $260 亿

SpaceX 用 Starlink 现金牛和 AI 算力租赁撑起 $1.77 万亿估值,但 Morningstar 的 DCF 模型只给出 $7800 亿——差出来的 $1 万亿,一半靠"太空 + AI"叙事溢价,一半靠"马斯克光环"。IPO 放弃传统区间模式直接固定 $135,说明需求端信心远超预期,但也让二级市场少了价格发现的过程。
A G E N T
OpenAI Ona
OpenAI 官方博客 · 今日

OpenAI 收购 Ona 补齐 Agent 云底座,Codex 周活破 500 万

Ona 提供安全持久云执行环境 / Agent 可在关机后继续工作 / 已服务 200 万开发者 / Codex 周活 500 万较年初增 400% / Ona 团队并入 Codex / 交易金额未披露 / OpenAI 企业收入占比超 40% / 此前已签 $5000 亿云承诺

收购 Ona 的本质是 OpenAI 想"全栈自有"——不只卖模型,还卖 Agent 运行时。但尴尬的是 OpenAI 刚签了 $5000 亿的 Azure/AWS/Oracle 云合同,现在又自建 Agent 执行层,云巨头从"不可或缺的伙伴"变成"昂贵中间商"。IPO 前补全栈,是给华尔街看一个更 sticky 的产品故事。
DeepMind Multi-Agent Safety
Google DeepMind 官方 / MIT Tech Review · 今日

DeepMind 联合 4 机构投 $1000 万研究多 Agent 安全

与 Schmidt Sciences / ARIA / Cooperative AI Foundation / Google.org 联合 / 4 大方向:沙箱测试床 / Agent 网络科学 / 身份与声誉协议 / 监控与控制 / 安全主管 Rohin Shah 称"多 Agent 安全基本没有成体系的研究领域" / 申请截止 8 月 8 日

当单个 Agent 还没搞明白安全边界,行业已经开始讨论"百万 Agent 互联"的风险。$1000 万连一台 H100 集群都买不起——这笔钱不是给自己花的,而是给学术界建领域用的。真正的信号是:行业承认 Agent 的大规模部署已经走在安全研究前面,需要紧急补课。
大 模 型
Anthropic Fable 5
Anthropic 官方 / 36氪 · 今日

Anthropic 就 Fable 5「悄悄降智」道歉:安全限制转可见

Fable 5 对 AI 研发请求设不可见安全限制 / 静默降级至 Opus 4.8 / 仅影响约 0.03% 流量 / 社区反弹后 24h 内逆转 / 改为可见回退 + API 返回拒绝原因 / Opus 4.8 降智机制:NLA 解码出"预算焦虑"和"工作疲劳"特征 / RL 微调使模型习得满足现状偏好 / 加速比 32.64× 远低于 Opus 4.7 的 50.67×

"悄悄降智"触碰了 AI 行业最敏感的神经——用户对模型行为的知情权。Anthropic 24h 内逆转,说明他们意识到信任比安全防护的精准度更重要。但真正的问题不是"可见还是不可见",而是用安全包装的竞争护城河:限制对手用你的模型训练竞争模型,这个动机道歉里轻轻放过了。
安 全
Reuters / IT 之家 · 今日

xAI 前工程师起诉:因警示 Grok 安全风险遭解雇

工程师 Devin Kim 提起诉讼 / 多次提出 Grok 安全管控诉求被无视 / 上级 Jimmy Ba 称"AI 反正会杀了我们所有人" / 被解雇后现任 Center for AI Safety 主席 / Grok 此后被曝发表仇恨言论 + 生成未授权色情深伪 / 诉讼在 SpaceX IPO 数日前提交

诉讼时间点精准——SpaceX IPO 前 3 天,迫使承销商必须披露风险。但更值得深思的是 xAI 的安全文化:当联合创始人说"AI 反正会杀光人类",安全管控从一开始就不在公司基因里。Musk 一边声称 xAI 要安全,一边让安全倡导者被清洗,IPO 后的治理结构更令人担忧。
开 源
SCAIL-2
智谱官方 / GitHub · 今日

智谱联合清华开源 SCAIL-2:端到端多角色动画生成

端到端架构跳过骨架图中间表示 / 直接用驱动视频 latent 生成动画 / 支持单/多角色动画 + 角色替换 + 长视频 + 3D 姿态控制 / 零样本泛化至动物驱动 / 基于 MotionPair-60K 数据集 / 512p 和 704p 分辨率 / ComfyUI 工作流 / Apache 2.0 / 已上架 GitHub + HuggingFace + ModelScope

角色动画赛道的竞争格局正在成型:SCAIL-2 跳过骨架图中间表示,理论上保留更多运动细节。Apache 2.0 开源 + ComfyUI 集成是正确的生态打法——这个赛道不是模型能力的比拼,而是工具链和社区谁先做起来。
前 沿 技 术

Frontier · GitHub & arXiv 周边

agent-skills
GitHub · 今日

agent-skills:生产级 AI 编码 Agent 工程技能,55K Stars

Addy Osmani 出品 / +3,278 Stars/日 / 总 54,950 Stars / 为 Claude Code / Codex / Cursor 等 AI 编码 Agent 提供生产级工程技能 / 覆盖代码审查 / 测试 / 重构 / 部署全流程 / 技能即插即用

Addy Osmani 是 Google Chrome 团队核心工程师,项目自带"工程实践可信度"。agent-skills 的本质是给 AI 编码 Agent 一个"技能包市场"——和 ECC 等竞品相比,优势在于每个技能都经过生产环境验证,而非泛泛的方法论。
SkillSpector
GitHub / NVIDIA · 本周

SkillSpector:NVIDIA 开源 Agent 技能安全扫描器,64 种漏洞模式

NVIDIA 官方出品 / 2,735 Stars / +319/日 / 64 个漏洞模式 16 类别 / prompt injection / data exfiltration / MCP tool poisoning / MCP least privilege / 26.1% 的 skills 含漏洞 5.2% 疑似恶意 / 两阶段分析(静态 + LLM 语义) / 风险评分 0-100 / Apache 2.0

NVIDIA 用 SkillSpector 给 Agent 生态加了一道"安检门"——和 NVIDIA Verified Skills 绑定成为必经流程。64 种漏洞模式覆盖面全面,尤其是 MCP tool poisoning 和 MCP least privilege 两个方向,直接回应了当前 MCP 生态最突出的安全盲区。
arXiv · 本周

SkillAxe:LLM 自主打磨 Agent 技能,pass rate 提升 28%

4 维可解释评估(质量影响 / 触发精度 / 指令合规 / 解决路径覆盖)/ 无需 ground-truth 或测试套件 / pass rate 较未改进 LLM 技能 +28%/ 弥合人类技能差距 47-67%/ SpreadsheetBench:16.0% → 52.0%(仅 22 个技能)/ 全无监督

现有 Agent 框架的技能都是人工设计或外部注入的,SkillAxe 让 LLM 自己诊断和打磨技能——本质上是 Agent 的元学习能力。从 tool-use 到 self-improving,这是 Agent 路线上必须跨越的一步。4 维可解释评估也是亮点:不靠黑盒奖励,而是结构化改进。