AI 日报 · 2026/05/26

推理优化

英伟达首款智能体CPU Vera交付，88核Olympus单核性能提50%

88颗NVIDIA自研Olympus核心 / 1.2TB/s内存带宽 / 单核性能提升50% / 首批交付Anthropic、OpenAI、SpaceXAI及甲骨文 / 甲骨文计划部署数十万颗 / 软件环境运行速度提升50%，效率为传统CPU 2倍

GPU吃掉了训练，CPU要吃掉推理——Vera是NVIDIA从"卖GPU"到"卖全栈"的又一次下探。单核50%的提升不是靠工艺，靠的是为Agentic AI定制的内存带宽和调度逻辑。甲骨文的"数十万颗"订单意味着这不会是实验室玩具。

大模型

X / @elonmusk · 今日 →

Grok V9-Medium 1.5T参数完成训练，马斯克称编码能力重大升级

1.5万亿参数（3倍于V8-Small的0.5T）/ 已完成预训练评估，进入微调阶段 / 强化学习数日后启动 / 预计2-3周内发布 / 训练数据加入大量Cursor编码数据 / SpaceXAI定位代码生成

参数量翻三倍不稀奇，稀奇的是马斯克公开说"训练数据加了Cursor"——这是在向开发者喊话：Grok不只聊天，它能写代码。但参数量≠编码质量，V9-Medium能不能在SWE-Bench上证明自己，才是硬指标。

IT之家 · 今日 →

GPT-5.6曝光：150万上下文窗口，Codex后端日志泄露iris-alpha

内部代号iris-alpha / 150万token上下文窗口（GPT-5.5为105万，提升43%）/ 另有ember-alpha和beacon-alpha版本 / 90万token实测流畅响应 / 前端界面生成"去Slop化"质变 / 预计6月发布

上下文窗口的军备竞赛已经从"谁更大"变成"谁更实用"。150万token意味着整个大型代码仓库可以一次性灌入，但也意味着推理成本指数级上涨——除非KV Cache优化跟上。GPT-5.6真正的看点不是窗口大小，是"去Slop化"的前端生成。

安全

Financial Times · 今日 →

欧洲央行紧急召集111家银行，Mythos安全模型震动金融圈

ECB银行监管委员会副主席Elderson召集临时会议 / Mythos已发现数千个高危漏洞，含主流OS和浏览器 / 欧洲银行无法获得Mythos访问权限 / 敦促美国银行与欧洲同行共享信息 / 要求补丁部署提速至30分钟内 / Anthropic同意为G20金融稳定委员会提供简报

Mythos的威力不在于"能挖漏洞"——好安全研究员一直能挖——在于"能大规模自动化挖漏洞"。当攻防不对等（攻击方有AI，防御方没有），监管的选项只剩两个：要么让所有人都拿到这个工具，要么禁掉它。ECB选了第一条路，但Anthropic的受邀制让这个选项很难落地。

融资

钛媒体 · 今日 →

Anthropic年收入突破440亿美元，Mythos从安全包袱变利润增长点

年化收入从2025年底90亿→2026年5月440亿 / Claude Code单产品年收25亿 / 百万美元以上企业客户超1000家（2月仅500家）/ Mythos定价：输入$25/百万token，输出$125/百万token（Opus 4.6的5倍）/ 已请Wilson Sonsini筹备IPO / Project Glasswing邀请制开放12家巨头

从90亿到440亿只用了5个月——但这个数字背后的驱动力不是"模型更聪明"，而是"工具更深地嵌入企业流程"。Mythos的高定价是个信号：安全不再是成本中心，是可以卖5倍溢价的利润品。IPO前把安全变现，这是Anthropic最精明的一步棋。

前沿技术

Frontier · GitHub & arXiv 周边

GitHub · 本周 →

微软开源Agent治理工具包：7大模块覆盖OWASP Agentic Top 10全10项

7个核心包（Agent OS/Mesh/Runtime/SRE/Compliance/Marketplace/Lightning）/ 覆盖OWASP Agentic Top 10全部10项风险 / 策略引擎<0.1ms p99延迟 / 5种语言（Python/TypeScript/Rust/Go/.NET）/ 13K+测试 / 20+框架集成（LangChain/CrewAI/AutoGen/Dify等）/ MIT开源 / v3.3.0

Agent治理从"论文讨论"到"可部署代码"的关键一步。微软没有选择做Agent框架，而是做了"Agent的操作系统"——管权限、管身份、管审计。OWASP 10/10覆盖不是营销，是给企业合规团队递了一张入场券。但核心挑战仍在：策略引擎和Agent共享进程边界，生产环境需要容器隔离。

GitHub · 本周 →

claude-context：语义代码搜索MCP Server，10.6K Stars让Agent精准定位代码

10.6K Stars / 基于Zilliz/Milvus向量数据库 / BM25+密集向量混合检索 / 兼容Claude Code/Cursor/Codex CLI/Gemini CLI等MCP客户端 / 单行安装 / 解决大型代码仓库上下文窗口爆炸问题

"把整个代码仓库喂给Claude"这条路走不通——太贵、太慢、太容易超出上下文窗口。claude-context的思路是"先检索再喂"，用向量搜索筛出相关代码片段，让Agent拿到精准上下文而不是全量噪音。这是MCP生态从"连接API"到"优化推理"的进化方向。

GitHub · 今日 →

Anthropic官方开源Claude Cowork插件库，15.5K Stars +1,441日增

15,583 Stars / 今日+1,441 / Anthropic官方仓库 / 面向知识工作者的Claude Cowork插件集 / GitHub Trending Python #1 / 开源

Anthropic不仅在做模型，也在做生态。知识工作者插件库的官方开源意味着Anthropic在复制VS Code Extension Marketplace的路径——让第三方开发者为Claude Cowork贡献能力，自己负责质量把关。15K Stars说明开发者社区确实在押注Claude生态。