AI 周报 · 第 20 周

本周关键信号 Key Signals

🌟🌟🌟 Anthropic 承诺 5 年向 Google Cloud 投入 2000 亿美元，锁定 TPU 算力

据 The Information 报道，Anthropic 与 Google Cloud 签署的 5 年基础设施合同金额约 2000 亿美元，占 Google Cloud 收入积压订单的 40% 以上。合同覆盖 Broadcom 合作交付的多吉瓦 TPU 算力，2027 年起上线。同月 Anthropic 还与 AWS 签署 1000 亿美元 / 10 年合同，与 SpaceX/xAI Colossus 1 数据中心达成 300MW 算力协议。Anthropic + OpenAI 两家公司合计占主要云厂商约 2 万亿美元积压订单的一半。

展开详情 ↓

涉及厂商：Anthropic ／ Google ／ Broadcom ／ AWS ／ SpaceX-xAI
类别：大模型算力
信源：The Tech Media · Business Times

🌟🌟🌟 OpenAI 成立 40 亿美元部署公司 DeployCo，收编 Tomoro 150 名工程师

OpenAI 成立多数控股的咨询子公司 DeployCo，初始投资超 40 亿美元，收购应用 AI 咨询公司 Tomoro，150 名工程师并入。合作方包括 TPG、Bain Capital、Brookfield 等 19 家。同周 OpenAI 三大产品线（ChatGPT / Codex / API）被强行合并，IPO 前组织重构信号明显。Codex 同步上线手机端（iOS/Android），新增 Hooks 安全合规脚本和 HIPAA 合规支持。

展开详情 ↓

涉及厂商：OpenAI ／ TPG ／ Bain Capital ／ Tomoro
类别：商业产品
信源：证券时报 · Dentro AI

🌟🌟🌟 DeepSeek 首轮融资 500 亿，估值 515 亿美元，国家大基金领投

DeepSeek 创始人梁文锋出资 200 亿占 40%，国家集成电路产业投资基金（大基金）洽谈领投，腾讯拟出资 60 亿获约 2% 股权。投后估值突破 3500 亿元人民币（约 515 亿美元），一个月内从 100 亿美元飙升 5 倍。V4 模型完成从 NVIDIA CUDA 到华为昇腾 CANN 的全链路迁移，成为首个不依赖英伟达的前沿模型。计划 6 月推出 V4.1，强化 MCP 协议适配与多模态能力。

展开详情 ↓

涉及厂商：DeepSeek ／国家大基金／腾讯／华为昇腾
类别：融资开源国产替代
信源：中国经营报 · 证券时报

🌟🌟 中国大模型"五强"集体刷新估值，智谱港股单日涨 36.9%

5 月 7–14 日一周内，月之暗面（20 亿美元 / 估值 200 亿）、阶跃星辰（25 亿美元 / 估值待定）、DeepSeek 三家未上市密集融资；已上市的智谱收盘涨 36.9%，市值首破 5000 亿港元；MiniMax 涨 18.46% 至 2566 亿港元。智谱 2025 年全年营收不足 8 亿元，市值 / 营收比远超科大讯飞。中国 AI 四强合计估值破万亿。

展开详情 ↓

涉及厂商：月之暗面／阶跃星辰／智谱／ MiniMax ／ DeepSeek
类别：融资
信源：东方财富 · 证券时报

🌟🌟 Musk 诉 OpenAI 案进入第三周：Altman 曝 Musk 曾要求 90% 股权

Satya Nadella 出庭称 Musk 从未质疑微软投资；Ilya Sutskever 透露持股估值 70 亿美元，否认曾承诺永久非营利；Sam Altman 作证称 Musk 早期要求 90% 股权后软化但坚持多数控制。Brockman 持股近 300 亿美元。5 月 15 日结辩，9 人陪审团即将裁决。Musk 索赔约 1500 亿美元，要求 Altman / Brockman 离职。

展开详情 ↓

涉及厂商：OpenAI ／ Microsoft ／ xAI
类别：诉讼治理
信源：澎湃新闻 · Daily Sabah / AFP

🌟🌟 Gemini 3.5 Pro "卡布奇诺"泄露，Google I/O 前最大信号

Gemini 3.5 Pro 代号 Cappuccino 泄露，编程能力对位 GPT-5.5。Agent 模式 Spark 引发隐私与信任讨论：可 24 小时自主执行购物、预订等长程任务。Google 同周发布 Android Gemini Intelligence 更新，将 AI 从聊天窗口推进到系统级 Agent 层——跨应用理解屏幕内容并完成多步操作。DeepMind 还推出 AI 原生鼠标指针，用户指向 + 说话即可触发 AI 操作。

展开详情 ↓

涉及厂商：Google ／ DeepMind
类别：大模型Agent
信源：36氪 · CNBC

🌟🌟 Anthropic 企业付费占比首超 OpenAI，Claude for Small Business 发布

Ramp 平台 5 月 AI 指数显示：Anthropic 付费企业客户占比 34.4%，首次超过 OpenAI 的 32.3%。Anthropic 同周推出 Claude for Small Business，嵌入 QuickBooks / PayPal / HubSpot / Canva / Docusign 等 15 个小企业工具，提供 15 个开箱即用 Agent 工作流。Opus 4.7 Fast 模式上线，付费用户编程额度提升 50%。

展开详情 ↓

涉及厂商：Anthropic ／ Intuit ／ PayPal ／ HubSpot
类别：企业AI
信源：钛媒体 · Dev Weekly

🌟 Apple M5 MIE 内存防护被 Claude Mythos 辅助攻破：5 年防线 5 天沦陷

安全公司 Calif 利用 Anthropic Claude Mythos 模型辅助，5 天内攻破 Apple M5 芯片的 Memory Integrity Enforcement (MIE)——苹果设计该硬件防线预期抵抗周期为 5 年。同周 Claude Mythos 正式现身 Google Cloud Marketplace，预览标签消失，暗示从实验性走向正式商用。

展开详情 ↓

涉及厂商：Apple ／ Anthropic ／ Calif ／ Google Cloud
类别：安全大模型
信源：财联社 · Tom's Hardware

厂商动态矩阵 Vendor Matrix

厂商	模型	产品／渠道	融资／估值	关键动作
OpenAI	GPT-5.5 Instant 默认上线；GPT-5.6 内测代号 ember-alpha / beacon-alpha	Codex 手机端 + Hooks + HIPAA；DeployCo 部署公司；Daybreak 安全产品	估值 $8500 亿；员工股票套现 $66 亿	三大产品线合并；IPO 前重构；Musk 诉讼结辩
Anthropic	Opus 4.7 Fast 模式；Claude Mythos 上 Google Cloud	Claude for Small Business（15 工具 / 15 工作流）；SpaceX/xAI 算力协议	ARR 440 亿；估值 $9000 亿–1 万亿	$2000 亿 Google Cloud 合同；$1000 亿 AWS 合同；企业付费占比首超 OpenAI
Google DeepMind	Gemini 3.5 Pro "Cappuccino" 泄露；AlphaEvolve 扩展至基因组 / 量子 / TPU	Android Gemini Intelligence 系统级 Agent；AI 原生鼠标指针	Alphabet 市值逼近 Nvidia	I/O 下周；Anthropic $2000 亿推高 Cloud backlog 至 $4600 亿
Meta	Muse Spark（MSL 首个核心模型）；Hatch Agent 开发中	智能购物工具	—	从"AI 布道者"转向"AI 竞争者"；$150 亿挖角 Scale AI 创始人
Microsoft	—	Copilot Max $100/月；Copilot CLI 替代 Claude Code；MDASH 安全 Agent	Azure AI 年化 $370 亿；Copilot 2000 万席位	取消内部 Claude Code 许可，转 Copilot CLI；Nadella 出庭
DeepSeek	V4 Preview（1.6T / 1M 上下文 / 昇腾全迁移）；V4.1 计划 6 月	—	首轮 500 亿／估值 $515 亿	大基金领投；梁文锋 200 亿；首个不依赖英伟达前沿模型
月之暗面	Kimi K2.6 编程模型开源	—	$20 亿／估值 $200 亿；ARR $2 亿+	美团龙珠领投；半年累计 $39 亿+
阶跃星辰	—	—	$25 亿／赴港 IPO 筹备中	产业链资本入场；拆除红筹架构
阿里云	Qwen3.6-27B 开源（Apache 2.0 / 262K）	Qoder 1.0 智能体自主开发工作台	—	刷屏 r/LocalLLaMA 1505 票；Qoder 对位 Cursor + Devin
蚂蚁集团	Ring-2.6-1T 开源	—	—	开源万亿参数 Agent 模型，对位 Claude Agent

技术演进趋势 Tech Trends

Agent Agent 竞争从"模型够不够聪明"转向"能不能在真实环境里干活"

本周至少 4 个独立信号指向同一方向：Anthropic 推出 15 个开箱即用小企业 Agent 工作流；Google 把 Gemini 从聊天窗口推进到 Android 系统级 Agent 层（跨应用操作、购物车、预订）；阿里云 Qoder 1.0 把 IDE 变成 Agent 自主开发工作台；蚂蚁 Ring-2.6 把万亿参数模型做成 Agent 框架开源。Agent 的竞争焦点已经不在 benchmark 分数，而在于：能不能理解屏幕上下文？能不能跨系统调用工具？能不能在用户授权的范围内自主完成多步任务？Google 的 AI 原生鼠标指针和 Android Gemini Intelligence 是本周最具体的信号——交互方式本身正在被重写。

论据① Anthropic Claude for Small Business 15 工作流 + Google Gemini Intelligence 跨应用 Agent · ② Qoder 1.0 + Ring-2.6 开源 Agent 框架 · ③ arXiv 本周两篇 Agent 论文：DOLORES（结构化元认知推理，8B 超 32B baseline +24.8%）和 ActFocus（动作 token 加权 RL，提升最高 63.7pp）

开源密集模型对位 MoE，本地部署门槛持续下降

Qwen3.6-27B 以密集架构在 r/LocalLLaMA 刷屏，262K 上下文 + Apache 2.0 协议，在多个 benchmark 匹配更大参数 MoE 模型。蚂蚁 Ring-2.6-1T 开源进一步压低万亿参数门槛。llama.cpp 合并 Speculative Checkpointing（PR #19493），推理优化从云端走向边缘。密集模型对位 MoE 的叙事在社区持续发酵——密集模型虽然参数效率不如 MoE，但在推理延迟和部署简化上有结构性优势，尤其适合本地和边缘场景。

论据① Qwen3.6-27B Reddit 1505 票 / 541 评论 · ② Ring-2.6-1T GitHub 开源 · ③ llama.cpp PR #19493 + Reddit 200+ 票 · 对比上月：Llama 4 Scout/Maverick 开源是 MoE 路线，本月密集路线反弹

推理推理优化的主战场从"怎么跑得快"变成"怎么跑得起"

本周几个信号暗示推理优化的关注点正在偏移：OpenAI 上线 GPT-5.5 Instant ultrafast 模式（提速 2–3x）；Anthropic 推出 Opus 4.7 Fast 模式；llama.cpp 的 Speculative Checkpointing 让边缘设备也能跑大模型。更深层的变化在算力侧——Anthropic 和 OpenAI 两家合计占云厂商 $2 万亿积压订单的一半，推理需求正在从"跑 benchmark"转向"支撑每天数十亿次 API 调用"的规模经济问题。谁能把推理成本压到最低，谁就能把 API 定价压到竞争对手亏损线以下。

论据① GPT-5.5 Instant ultrafast + Opus 4.7 Fast 同周发布 · ② Anthropic $2000 亿 + OpenAI $1400 亿云基础设施锁定 · ③ llama.cpp 边缘推理优化

研究 Agent 记忆和推理的可靠性问题浮出水面

awesomeagents.ai 本周汇总的三篇论文暴露了 Agent 系统的脆弱面：GPT-5.4 在连续记忆更新后 54% 的已解决问题无法复现（记忆整合反而降低性能）；LLM 在多轮对话中会"沉默地"丢失指令（Goal Accessibility Ratio 可预测崩溃点）；SU-01 证明 30B MoE 模型通过反向困惑度课程学习 + 自验证可以达到奥赛金牌水平，但需要 100K+ token 的推理链。Agent 能力上限在提高，但稳定性下限的问题可能更紧迫。

论据① arXiv 2605.12978 记忆整合退化 · ② Goal Accessibility Ratio 诊断指标 · ③ SU-01 (arXiv:2605.13301) 30B 奥赛金牌

治理学术与政策层面对 AI 输出可靠性的红线在收紧

arXiv 宣布对 AI 幻觉违规作者禁投 1 年——这是学术预印本平台首次对 AI 生成内容采取惩罚措施。美国参议院同周向微软、Google、X、Anthropic、Perplexity 五家发出正式问询，要求 30 日内提交 LLM 安全性和透明度说明。两条信号叠加：AI 输出的可靠性不再只是技术问题，而是合规和学术诚信问题。

论据① arXiv AI 幻觉禁投政策 · ② 美国参议院五公司问询 · 对比上月：欧盟 AI Act 执行细则刚落地，监管密度在加速

商业格局变化 Business Landscape

云厂商的 AI 收入高度依赖两家亏损公司

Anthropic + OpenAI 合计占 AWS / Azure / GCP / Oracle 约 $2 万亿积压订单的一半。Anthropic 单独占 Google Cloud 积压订单的 40%+。这意味着云厂商的 AI 增长叙事建立在少数客户能否实现 20–30 倍收入增长的假设之上。Oracle 股价自去年 9 月已跌 45%（OpenAI $3000 亿合同后市场质疑实际执行率），而 Google 和 Amazon 的赌注在于：自研芯片（TPU / Trainium）的毛利率远高于出租 Nvidia GPU。云厂商的 AI 收入质量取决于自研芯片占比，而非单纯订单规模。

中国大模型估值体系被 DeepSeek 重构，"四强"合计破万亿

DeepSeek 估值从 4 月中旬的 $100 亿飙升至 $515 亿，成为整个赛道的定价锚。月之暗面 $200 亿、阶跃星辰接近 $200 亿、智谱 5000 亿港元、MiniMax 2500 亿港元——中国 AI 四强合计估值破万亿人民币。但营收与估值的落差同样惊人：智谱 2025 年营收不足 8 亿元，市值 / 营收比超过 500 倍。这个估值体系的核心支撑不是当前商业化能力，而是"国产替代叙事"和"全栈自主可控"的溢价——DeepSeek V4 完成昇腾适配后，国产芯片概念股全线暴涨。

部署与实施成为 AI 公司的新战场

OpenAI 成立 DeployCo、Anthropic 推 Claude for Small Business、Google 把 Gemini 嵌入 Android 系统层——三巨头本周同时转向"最后一公里"交付。背后逻辑：模型能力差异在缩小（GPT-5.5 vs Claude Opus 4.7 vs Gemini 3.5 在多数 benchmark 上差距 <5%），但企业能否用起来取决于实施质量。DeployCo 的 Palantir 路线（卖人 + 卖方法论）和 Claude for Small Business 的 SaaS 路线（卖开箱即用工作流）代表了两种截然不同的交付策略。谁能先把 Fortune 500 的落地数字拿出来，谁就拿到了下一轮估值的入场券。

Microsoft 从 OpenAI 独占转向多模型策略

Microsoft 取消内部 Claude Code 许可、将工程师迁至 Copilot CLI；同周 OpenAI 获得与其他云厂商（AWS / GCP）深化合作的自由度。双方关系正在从"排他绑定"向"合作但开放"调整。Nadella 出庭时的措辞耐人寻味："我对我们冒险赞助了这家初生实验室感到非常自豪"——用的是"赞助"而非"投资"。Microsoft 的策略是：不把鸡蛋放在一个篮子里，用 Copilot 作为多模型路由层（GPT + Claude + Gemini 都可通过 Copilot CLI 访问），自己做"AI 中间件"而非依赖单一模型提供商。

自改进 AI 成为新的融资叙事

前 Salesforce 首席科学家 Richard Socher 创办 Recursive Superintelligence，$6.5 亿 Series A / 估值 $46.5 亿，GV / Greycroft 领投，Nvidia / AMD 跟投。前 Meta FAIR 科学家田渊栋任联合创始人，Peter Norvig 加盟。同周 Nathan Lambert 发布中国 AI 实验室巡访报告，确认中国开发者尽管名义上受限，大多数仍偏好 Claude。自改进 AI 的叙事从学术论文（OpenAI GPT-5.5 内部发现更高效并行化方法，性能提升 20%+）延伸到创业公司——但"AI 改进 AI"的验证周期远比预训练长，这个赛道的死亡率可能也很高。

下周观察清单 Watchlist

Google I/O（5/20–21）：Gemini 3.5 Pro 是否正式发布

卡布奇诺泄露后，Google 需要在 I/O 上给出官方版本和定价。关注：Spark Agent 的隐私边界如何定义、TPU v6 发布节奏、与 Apple Intelligence 的合作细节。如果 Gemini 3.5 Pro 正式发布且编程能力确实对位 GPT-5.5，模型差距将进一步收窄。

Musk 诉 OpenAI 案陪审团裁决

9 人陪审团预计本周开始审议。法官 Yvonne Gonzalez Rogers 表示大概率采纳陪审团意见。核心看点：OpenAI 是否被要求回归非营利架构。如果裁决对 Musk 有利，OpenAI 的 IPO 计划和 $8500 亿估值将受到直接冲击；如果对 OpenAI 有利，Musk 的 xAI 将失去一个重要的法律施压工具。

OpenAI DeployCo 首批客户公告：能否给出 Fortune 500 落地数字

DeployCo 成立后的第一个客户名单和交付成果，将决定"部署公司"这条路线是否成立。关注是否有可量化的效率提升数据（而非模糊的"AI 赋能"描述），以及 Tomoro 150 人团队的整合进度。

DeepSeek V4.1 是否如期在 6 月上线，Agent benchmark 能否兑现

V4.1 计划强化 MCP 协议适配和多模态能力。作为首轮融资的关键技术支撑，V4.1 的实际表现将直接影响估值能否维持 $515 亿水平。关注：华为昇腾适配的推理效率是否达到商用水平。

Anthropic 企业付费占比趋势：34.4% 是拐点还是峰值

Ramp 指数显示 Anthropic 首超 OpenAI，但这是基于 Anthropic 客户的付费渗透率而非绝对数量。OpenAI 本周反击（向迁移企业提供两月免费 Codex），下周观察 OpenAI 的企业端动作是否遏制 Anthropic 的增长势头。