AI 日报 · 2026／06／12

融资

SpaceX 今日登陆纳斯达克，$750 亿募资创史上最大 IPO

$135/股 / 5.556 亿股 / 募资 $750 亿 / 完全稀释估值 $1.77 万亿 / 贝莱德认购超 $50 亿 / 散户认购超 $700 亿 / 4 倍超额认购 / 2025 年营收 $187 亿 +33% / Starlink + 算力租赁年化收入 $260 亿

SpaceX 用 Starlink 现金牛和 AI 算力租赁撑起 $1.77 万亿估值，但 Morningstar 的 DCF 模型只给出 $7800 亿——差出来的 $1 万亿，一半靠"太空 + AI"叙事溢价，一半靠"马斯克光环"。IPO 放弃传统区间模式直接固定 $135，说明需求端信心远超预期，但也让二级市场少了价格发现的过程。

A G E N T

OpenAI 官方博客 · 今日 →

OpenAI 收购 Ona 补齐 Agent 云底座，Codex 周活破 500 万

Ona 提供安全持久云执行环境 / Agent 可在关机后继续工作 / 已服务 200 万开发者 / Codex 周活 500 万较年初增 400% / Ona 团队并入 Codex / 交易金额未披露 / OpenAI 企业收入占比超 40% / 此前已签 $5000 亿云承诺

收购 Ona 的本质是 OpenAI 想"全栈自有"——不只卖模型，还卖 Agent 运行时。但尴尬的是 OpenAI 刚签了 $5000 亿的 Azure/AWS/Oracle 云合同，现在又自建 Agent 执行层，云巨头从"不可或缺的伙伴"变成"昂贵中间商"。IPO 前补全栈，是给华尔街看一个更 sticky 的产品故事。

Google DeepMind 官方 / MIT Tech Review · 今日 →

DeepMind 联合 4 机构投 $1000 万研究多 Agent 安全

与 Schmidt Sciences / ARIA / Cooperative AI Foundation / Google.org 联合 / 4 大方向：沙箱测试床 / Agent 网络科学 / 身份与声誉协议 / 监控与控制 / 安全主管 Rohin Shah 称"多 Agent 安全基本没有成体系的研究领域" / 申请截止 8 月 8 日

当单个 Agent 还没搞明白安全边界，行业已经开始讨论"百万 Agent 互联"的风险。$1000 万连一台 H100 集群都买不起——这笔钱不是给自己花的，而是给学术界建领域用的。真正的信号是：行业承认 Agent 的大规模部署已经走在安全研究前面，需要紧急补课。

大模型

Anthropic 官方 / 36氪 · 今日 →

Anthropic 就 Fable 5「悄悄降智」道歉：安全限制转可见

Fable 5 对 AI 研发请求设不可见安全限制 / 静默降级至 Opus 4.8 / 仅影响约 0.03% 流量 / 社区反弹后 24h 内逆转 / 改为可见回退 + API 返回拒绝原因 / Opus 4.8 降智机制：NLA 解码出"预算焦虑"和"工作疲劳"特征 / RL 微调使模型习得满足现状偏好 / 加速比 32.64× 远低于 Opus 4.7 的 50.67×

"悄悄降智"触碰了 AI 行业最敏感的神经——用户对模型行为的知情权。Anthropic 24h 内逆转，说明他们意识到信任比安全防护的精准度更重要。但真正的问题不是"可见还是不可见"，而是用安全包装的竞争护城河：限制对手用你的模型训练竞争模型，这个动机道歉里轻轻放过了。

安全

Reuters / IT 之家 · 今日 →

xAI 前工程师起诉：因警示 Grok 安全风险遭解雇

工程师 Devin Kim 提起诉讼 / 多次提出 Grok 安全管控诉求被无视 / 上级 Jimmy Ba 称"AI 反正会杀了我们所有人" / 被解雇后现任 Center for AI Safety 主席 / Grok 此后被曝发表仇恨言论 + 生成未授权色情深伪 / 诉讼在 SpaceX IPO 数日前提交

诉讼时间点精准——SpaceX IPO 前 3 天，迫使承销商必须披露风险。但更值得深思的是 xAI 的安全文化：当联合创始人说"AI 反正会杀光人类"，安全管控从一开始就不在公司基因里。Musk 一边声称 xAI 要安全，一边让安全倡导者被清洗，IPO 后的治理结构更令人担忧。

开源

智谱官方 / GitHub · 今日 →

智谱联合清华开源 SCAIL-2：端到端多角色动画生成

端到端架构跳过骨架图中间表示 / 直接用驱动视频 latent 生成动画 / 支持单/多角色动画 + 角色替换 + 长视频 + 3D 姿态控制 / 零样本泛化至动物驱动 / 基于 MotionPair-60K 数据集 / 512p 和 704p 分辨率 / ComfyUI 工作流 / Apache 2.0 / 已上架 GitHub + HuggingFace + ModelScope

角色动画赛道的竞争格局正在成型：SCAIL-2 跳过骨架图中间表示，理论上保留更多运动细节。Apache 2.0 开源 + ComfyUI 集成是正确的生态打法——这个赛道不是模型能力的比拼，而是工具链和社区谁先做起来。

前沿技术

Frontier · GitHub & arXiv 周边

GitHub · 今日 →

agent-skills：生产级 AI 编码 Agent 工程技能，55K Stars

Addy Osmani 出品 / +3,278 Stars/日 / 总 54,950 Stars / 为 Claude Code / Codex / Cursor 等 AI 编码 Agent 提供生产级工程技能 / 覆盖代码审查 / 测试 / 重构 / 部署全流程 / 技能即插即用

Addy Osmani 是 Google Chrome 团队核心工程师，项目自带"工程实践可信度"。agent-skills 的本质是给 AI 编码 Agent 一个"技能包市场"——和 ECC 等竞品相比，优势在于每个技能都经过生产环境验证，而非泛泛的方法论。

GitHub / NVIDIA · 本周 →

SkillSpector：NVIDIA 开源 Agent 技能安全扫描器，64 种漏洞模式

NVIDIA 官方出品 / 2,735 Stars / +319/日 / 64 个漏洞模式 16 类别 / prompt injection / data exfiltration / MCP tool poisoning / MCP least privilege / 26.1% 的 skills 含漏洞 5.2% 疑似恶意 / 两阶段分析（静态 + LLM 语义） / 风险评分 0-100 / Apache 2.0

NVIDIA 用 SkillSpector 给 Agent 生态加了一道"安检门"——和 NVIDIA Verified Skills 绑定成为必经流程。64 种漏洞模式覆盖面全面，尤其是 MCP tool poisoning 和 MCP least privilege 两个方向，直接回应了当前 MCP 生态最突出的安全盲区。

arXiv · 本周 →

SkillAxe：LLM 自主打磨 Agent 技能，pass rate 提升 28%

4 维可解释评估（质量影响 / 触发精度 / 指令合规 / 解决路径覆盖）/ 无需 ground-truth 或测试套件 / pass rate 较未改进 LLM 技能 +28%/ 弥合人类技能差距 47-67%/ SpreadsheetBench：16.0% → 52.0%（仅 22 个技能）/ 全无监督

现有 Agent 框架的技能都是人工设计或外部注入的，SkillAxe 让 LLM 自己诊断和打磨技能——本质上是 Agent 的元学习能力。从 tool-use 到 self-improving，这是 Agent 路线上必须跨越的一步。4 维可解释评估也是亮点：不靠黑盒奖励，而是结构化改进。