SpaceX 6月12日以 $2万亿+ 市值完成纳斯达克上市,6月16日即宣布以 $600 亿全股票收购 Cursor 母公司 Anysphere——分文现金未花。Cursor 年化企业收入约 $26 亿,去年11月估值仅 $293 亿。收购本质是 Colossus(百万 H100 等效算力)+ Cursor(开发者渠道)的算力-产品闭环。xAI 此前在 AI 编程市场落后于 OpenAI Codex 和 Anthropic Claude Code,Cursor 补齐了这一短板。
值得注意的是,4月 xAI 已从 Cursor 挖走两名工程负责人 Andrew Milich 和 Jason Ginsberg,5月 xAI 并入 SpaceX AI,6月即完成收购——从挖人到吞并,不到两个月。全股票交易意味着 Cursor 股东押注 SpaceX 股价继续走高,而非落袋为安。
6月17日,Transformer 论文核心作者、Gemini 联合负责人 Noam Shazeer 宣布加入 OpenAI,将专注新架构探索。6月20日,AlphaFold 核心缔造者、2024 诺贝尔化学奖得主 John Jumper 宣告离开 DeepMind 加盟 Anthropic。两人出走间隔仅 72 小时。
Shazeer 2024年被 Google 以 $27 亿授权交易召回,不到两年再次出走。据 The Information 报道,Google 内部多部门评审、产品迭代周期长于行业平均,是核心研究员持续流失的主因。Jumper 同时是 Google AI 编程工具团队的关键成员,他的离开意味着 Google 在 AI 编程赛道的布局再受打击——而这正是 OpenAI 和 Anthropic 增长最快的业务。
过去八年,Google 已有 20 余名里程碑论文核心作者离职。D.A. Davidson 分析师 Gil Luria 指出:前沿 AI 实验室能承诺更少层级束缚、更集中的超级智能研究方向,是人才持续外流的结构性原因。
6月12日美商务部以国家安全为由对 Anthropic Fable 5/Mythos 5 实施出口管制后,至本周末仍未恢复。管制按国籍执行(而非所在地),连 Anthropic 在美的外籍员工都无法使用,迫使公司全球断网。Anthropic 发长文反驳:政府依据的是一个窄域、非通用越狱,且 GPT-5.5 能做到同样的事——若此标准全行业适用,"将实质叫停所有前沿模型部署"。
6月17日 G7 埃维昂峰会首次设置 AI 工作午餐,Altman、Amodei、Hassabis 与七国领导人同桌。Amodei 与 Hassabis 联合提议建立美国主导的 AI 联盟,包括前沿模型分层访问、芯片贸易排除中国。加拿大总理 Carney 支持美国主导,并引用自己曾主持的金融稳定委员会(FSB)作为制度参照。但会议未产生任何有约束力的协议。
智谱 6月17日正式上线并开源 GLM-5.2。核心数据:百万用户盲测 Code Arena 全球可用模型第一;FrontierSWE 比 Claude Opus 4.8 仅低 1%,超过 GPT-5.5;Terminal-Bench 2.1 得分 81.0(前代 63.5,+17.5pp);1M 无损上下文;MIT 协议商用无限制。
Day 0 完成华为昇腾、平头哥、摩尔线程、寒武纪、昆仑芯、沐曦、海光、壁仞共 8 家国产算力平台推理适配。训练与线上推理均未依赖海外算力。这是中国开源模型首次在编程能力上与闭源头部模型进入 1-4% 差距区间,且选择最宽松的开源协议。
6月18日 ChatGPT 消费端上线 3D 活体身份验证(通过 Persona 服务),Anthropic 同步宣布 7月8日起 Claude 用户须实名认证。同周,美国参议院司法委员会以 22:0 通过 GUARD 法案——要求所有 AI 聊天机器人用户上传政府 ID 或刷脸验证年龄,覆盖范围远超未成年人保护。
AI 工具从"匿名公共设施"变为"实名管制品"的速度超出预期。法案定义极宽——任何接受开放性自然语言输入的 AI 系统均在覆盖范围内,包括客服机器人。这直接影响 Agent 的使用门槛:如果每次对话都需身份验证,企业端部署成本和用户流失率都将上升。
Salesforce 以 $36 亿收购 AI 客服平台 Fin(原 Intercom 旗下),为 Agentforce 产品线补齐智能客服能力。这是 AI Agent 赛道迄今最大单笔收购,远超此前 OpenAI 收购 Ona(金额未披露但估计在 $5 亿以内)。
同周 OpenAI 宣布 $1.5 亿合作伙伴网络(目标 30 万认证顾问,Accenture 已加入),以及 $5000 万非营利承诺——这是对纽约州传票的回应,也是 IPO 前企业化布局的组合拳。
| 厂商 | 模型 | 产品 / 动作 | 融资 / 估值 |
|---|---|---|---|
| OpenAI | GPT-5.5(6/27 退役 GPT-4.5) | 合作伙伴网络 $1.5 亿 + 30 万认证顾问;$5000 万非营利承诺;Codex Record & Replay;ChatGPT 定时任务取代 Pulse;身份验证上线 | 去年支出 $340 亿 / 亏损 $385 亿;IPO 前纽约州传票;估值 ~$8500 亿 |
| Anthropic | Fable 5 / Mythos 5(仍下线) | 7/8 起 Claude 实名认证;G7 提出分层访问框架;Jumper 加盟(AI 生命科学) | ARR $470 亿;估值 ~$9650 亿;Google $350 亿数据中心担保 |
| Google DeepMind | Gemini 3.5 Flash(AI Mode 默认模型) | Shazeer + Jumper 两连出走;AI Mode 信息智能体 7×24;Gemini 3.5 Flash 默认 | Alphabet 市值逼近 Nvidia;$350 亿担保 Anthropic |
| SpaceX / xAI | Grok / Composer(Cursor 自研) | 上市四天收购 Cursor $600 亿全股;Colossus 百万 H100 等效算力 | 市值 $2.5 万亿+;算力租赁月入 $21.7 亿 |
| Meta | Muse Spark | Facebook AI Mode 上线(20 亿用户);AI 编程工具销售遇阻 | — |
| 智谱 | GLM-5.2(744B MoE / MIT) | Code Arena 全球第一;1M 上下文;8 家国产算力 Day 0 适配 | 港股上市(02513.HK) |
| 阿里 | Qwen-Robot 系列 | RobotManip + RobotWorld 具身智能;Token Foundry 事业部 | CEO 直管 AI 全链路 |
| Salesforce | Agentforce | $36 亿收购 Fin 补齐客服 Agent | — |
本周三件事共同勾勒出 AI 编程赛道的新阶段:SpaceX 以 $600 亿收购 Cursor、Microsoft 开源 Fara-7B(Computer Use Agent 模型)、OpenAI Codex 上线 Record & Replay 功能。Cursor 的被收购意味着编程 Agent 不再是"IDE 插件"的定位,而是成为算力平台的前端交互界面——Colossus 算力 + Cursor 开发者渠道的组合,与 OpenAI(Codex + Ona)和 Anthropic(Claude Code)形成了三足鼎立的编程 Agent 基础设施格局。
另一个信号:GitHub 6月可用性跌至 88.4%,AI Agent 开的 PR 从 2025年9月的 400 万飙升到 2026年3月的 1700 万,微软被迫将 GitHub 部分算力分流到 AWS——编程 Agent 的爆发式增长已经冲击到承载它的基础设施。
本周 arXiv 同时出现三篇 Agent 自进化框架论文:Self-Harness(Terminal-Bench 2.0 MiniMax M2.5 从 40.5%→61.9%)、MLEvolve(AlphaEvolve 思路迁移到 ML 工程)、APEX(三层自进化:harness → 原则蒸馏 → 工作流拓扑)。三篇论文的共同思路是:让 Agent 在运行中发现自身弱点、提出改进方案、验证后自动应用,无需人类介入。
结合上周的 OpenSquilla(Token-efficient 微内核 Agent,成本降 90%),方向很明确:Agent 的竞争力正从"模型能力"转向"运行效率"——同样的模型,谁能用更少的 Token、更少的迭代完成同样的任务,谁就胜出。
GLM-5.2 在 FrontierSWE 上仅比 Claude Opus 4.8 低 1%,超过 GPT-5.5;Code Arena 盲测全球可用模型第一。这是开源模型首次在编程能力上与闭源头部进入 1-4% 差距区间。更值得注意的是协议选择:MIT 而非 Apache 2.0 或更限制性协议,意味着任何企业可直接商用、修改、再分发——对 DeepSeek(首轮融资 $515 亿)和千问系列构成了直接竞争压力。
另一层意义:训练和推理均未依赖海外算力,Day 0 适配 8 家国产芯片。在中美算力脱钩背景下,这为国产算力生态提供了第一个"可验证的顶级模型"锚点。
微软开源 Fara-7B(7B 参数 Computer Use Agent 模型),CUA 项目(18K Stars)提供跨平台沙箱基础设施,Chrome DevTools MCP(43.2K Stars)让 AI Agent 可以直接操控浏览器调试。三个项目分别覆盖模型层、运行时层和工具层。
Computer Use Agent 与传统编程 Agent 的区别在于:它不操作代码,而是直接操作 GUI——像人一样点击、输入、截图。这意味着 AI 可以部署到任何软件环境(包括没有 API 的遗留系统),但同时也带来了更高的安全风险和更难的对齐问题。GUARD 法案的身份验证要求将直接影响 Computer Use Agent 的部署门槛。
Shazeer 和 Jumper 72 小时内先后出走 Google,不是孤立事件。过去八年 Google 有 20+ 核心论文作者离职,流向 OpenAI、Anthropic 和 Microsoft。本周的特别之处在于出走者的级别——Gemini 联合负责人和诺奖得主同时离开,且两人都去了直接竞争对手。
更深层的问题是:Google 的 AI 编程工具销售进展不顺,内部高管公开担忧无法向企业客户提供清晰方案——而 AI 编程正是 OpenAI 和 Anthropic 增长最快的业务。人才流失和业务困局互为因果:核心人出走→产品节奏放缓→收入增长不及预期→更多核心人出走。
Visa × ChatGPT 和微信支付 AI 专属卡在同一周落地,不是巧合。Agent 要完成从"建议"到"执行"的闭环,必须解决支付问题。中国路线(专属钱包 + 主账户隔离)更像"给 AI 发一张借记卡",美国路线(信用卡网络令牌化)更像"给 AI 一个授权码"。京东的 A2P2 协议则试图建立智能体之间的支付信任框架。
关键差异在于用户习惯:中国用户已习惯"扫码即付",AI 支付是现有习惯的延伸;美国用户更依赖信用卡网络,AI 支付需要嵌入 Visa/Mastercard 体系。两条路线的最终目标一致:让 Agent 在人类授权范围内自主完成资金流转。
Fable 5 出口管制、G7 AI 午餐会、GUARD 法案 22:0 通过、上交所科创板指引——四件事指向同一趋势:政府正在加速介入 AI 治理。但介入方式和速度极不均衡。美国商务部可以一纸行政令叫停一个模型,但 G7 无法就 AI 标准论坛达成任何有约束力的协议。Anthropic 呼吁的"基于技术事实、透明公平的法定程序"尚不存在。
中国方面,科创板指引为 AI 公司资本退出打开通道,但标准是"规模化应用"而非技术指标——这意味着还在烧钱阶段的大模型公司仍需证明商业化能力。制度供给的滞后性意味着:短期内,企业将在不确定的监管环境中做战略决策。
OpenAI 去年支出 $340 亿、亏损 $385 亿;Google 为 Anthropic 担保 $350 亿数据中心融资;全球 AI 债务融资规模达 $2360 亿(摩根士丹利数据),是去年的 4 倍。AI 竞赛的资金形态正在从"股权融资烧钱"转向"举债建基础设施"——与早期电信行业的路径相似。
债务融资意味着还款压力。如果 AI 应用收入增长不及预期(OpenAI 的 ARR 约 $127 亿 vs $340 亿支出),债务违约风险将上升。SpaceX 用全股票收购 Cursor 而非现金,某种程度上也反映了资金效率考量——用高估值股票而非真金白银完成交易。