VOL · 7

把今天的 AI
一杯咖啡读完

每日精选 · 一手源优先 · 看见 AI 浪潮的真实方向

2026 / 05 / 26 · 周二

推 理 优 化
NVIDIA Vera CPU
NVIDIA 官方博客 · 今日

英伟达首款智能体CPU Vera交付,88核Olympus单核性能提50%

88颗NVIDIA自研Olympus核心 / 1.2TB/s内存带宽 / 单核性能提升50% / 首批交付Anthropic、OpenAI、SpaceXAI及甲骨文 / 甲骨文计划部署数十万颗 / 软件环境运行速度提升50%,效率为传统CPU 2倍

GPU吃掉了训练,CPU要吃掉推理——Vera是NVIDIA从"卖GPU"到"卖全栈"的又一次下探。单核50%的提升不是靠工艺,靠的是为Agentic AI定制的内存带宽和调度逻辑。甲骨文的"数十万颗"订单意味着这不会是实验室玩具。
大 模 型
X / @elonmusk · 今日

Grok V9-Medium 1.5T参数完成训练,马斯克称编码能力重大升级

1.5万亿参数(3倍于V8-Small的0.5T)/ 已完成预训练评估,进入微调阶段 / 强化学习数日后启动 / 预计2-3周内发布 / 训练数据加入大量Cursor编码数据 / SpaceXAI定位代码生成

参数量翻三倍不稀奇,稀奇的是马斯克公开说"训练数据加了Cursor"——这是在向开发者喊话:Grok不只聊天,它能写代码。但参数量≠编码质量,V9-Medium能不能在SWE-Bench上证明自己,才是硬指标。
GPT-5.6
IT之家 · 今日

GPT-5.6曝光:150万上下文窗口,Codex后端日志泄露iris-alpha

内部代号iris-alpha / 150万token上下文窗口(GPT-5.5为105万,提升43%)/ 另有ember-alpha和beacon-alpha版本 / 90万token实测流畅响应 / 前端界面生成"去Slop化"质变 / 预计6月发布

上下文窗口的军备竞赛已经从"谁更大"变成"谁更实用"。150万token意味着整个大型代码仓库可以一次性灌入,但也意味着推理成本指数级上涨——除非KV Cache优化跟上。GPT-5.6真正的看点不是窗口大小,是"去Slop化"的前端生成。
安 全
Financial Times · 今日

欧洲央行紧急召集111家银行,Mythos安全模型震动金融圈

ECB银行监管委员会副主席Elderson召集临时会议 / Mythos已发现数千个高危漏洞,含主流OS和浏览器 / 欧洲银行无法获得Mythos访问权限 / 敦促美国银行与欧洲同行共享信息 / 要求补丁部署提速至30分钟内 / Anthropic同意为G20金融稳定委员会提供简报

Mythos的威力不在于"能挖漏洞"——好安全研究员一直能挖——在于"能大规模自动化挖漏洞"。当攻防不对等(攻击方有AI,防御方没有),监管的选项只剩两个:要么让所有人都拿到这个工具,要么禁掉它。ECB选了第一条路,但Anthropic的受邀制让这个选项很难落地。
融 资
Anthropic
钛媒体 · 今日

Anthropic年收入突破440亿美元,Mythos从安全包袱变利润增长点

年化收入从2025年底90亿→2026年5月440亿 / Claude Code单产品年收25亿 / 百万美元以上企业客户超1000家(2月仅500家)/ Mythos定价:输入$25/百万token,输出$125/百万token(Opus 4.6的5倍)/ 已请Wilson Sonsini筹备IPO / Project Glasswing邀请制开放12家巨头

从90亿到440亿只用了5个月——但这个数字背后的驱动力不是"模型更聪明",而是"工具更深地嵌入企业流程"。Mythos的高定价是个信号:安全不再是成本中心,是可以卖5倍溢价的利润品。IPO前把安全变现,这是Anthropic最精明的一步棋。
前 沿 技 术

Frontier · GitHub & arXiv 周边

Agent Governance Toolkit
GitHub · 本周

微软开源Agent治理工具包:7大模块覆盖OWASP Agentic Top 10全10项

7个核心包(Agent OS/Mesh/Runtime/SRE/Compliance/Marketplace/Lightning)/ 覆盖OWASP Agentic Top 10全部10项风险 / 策略引擎<0.1ms p99延迟 / 5种语言(Python/TypeScript/Rust/Go/.NET)/ 13K+测试 / 20+框架集成(LangChain/CrewAI/AutoGen/Dify等)/ MIT开源 / v3.3.0

Agent治理从"论文讨论"到"可部署代码"的关键一步。微软没有选择做Agent框架,而是做了"Agent的操作系统"——管权限、管身份、管审计。OWASP 10/10覆盖不是营销,是给企业合规团队递了一张入场券。但核心挑战仍在:策略引擎和Agent共享进程边界,生产环境需要容器隔离。
claude-context
GitHub · 本周

claude-context:语义代码搜索MCP Server,10.6K Stars让Agent精准定位代码

10.6K Stars / 基于Zilliz/Milvus向量数据库 / BM25+密集向量混合检索 / 兼容Claude Code/Cursor/Codex CLI/Gemini CLI等MCP客户端 / 单行安装 / 解决大型代码仓库上下文窗口爆炸问题

"把整个代码仓库喂给Claude"这条路走不通——太贵、太慢、太容易超出上下文窗口。claude-context的思路是"先检索再喂",用向量搜索筛出相关代码片段,让Agent拿到精准上下文而不是全量噪音。这是MCP生态从"连接API"到"优化推理"的进化方向。
knowledge-work-plugins
GitHub · 今日

Anthropic官方开源Claude Cowork插件库,15.5K Stars +1,441日增

15,583 Stars / 今日+1,441 / Anthropic官方仓库 / 面向知识工作者的Claude Cowork插件集 / GitHub Trending Python #1 / 开源

Anthropic不仅在做模型,也在做生态。知识工作者插件库的官方开源意味着Anthropic在复制VS Code Extension Marketplace的路径——让第三方开发者为Claude Cowork贡献能力,自己负责质量把关。15K Stars说明开发者社区确实在押注Claude生态。