AI 日报 · 2026 年 5 月 22 日

A G E N T

OpenAI Codex 大更新：Goal Mode 正式上线，Agent 可远程锁屏运行

Appshots 一键截取任意应用窗口喂给 Codex / Goal Mode 从实验转正式，定义目标后 Agent 自主运行数小时甚至数天 / Locked Computer Use 锁屏后仍可远程操控 / Plugin Sharing 企业内部分享插件 / 浏览器标注增强 + 管理后台分析面板

从"写代码的工具"到"可以独立干活的 Agent"——Goal Mode 正式版是最关键的跳跃：定义目标和成功标准，Codex 自己跑到底。锁屏远程运行意味着 Agent 第一次不需要人类盯着屏幕，但这也把信任边界推到了新高度。

大模型

凤凰网科技 · 今日 →

智谱 GLM-5.1 高速版：400 tok/s 刷新全球 API 速度纪录

输出速度 400 tokens/s，刷新全球大模型 API 速度上限 / 基于旗舰级 GLM-5.1 能力开发，非轻量级模型 / 30 秒生成复杂网页代码 / Agent Swarm 场景瞬间调度 50 个并行 Agent / GLM 团队 + TileRT 联合打造系统级优化

速度本身不是护城河，但"旗舰能力 + 极致速度"这个组合才是。此前高速模型都是轻量级的妥协，智谱证明了推理引擎和调度系统的系统级优化可以在不牺牲模型能力的前提下压出性能。国内 API 价格战之后，速度战开始了。

每日经济新闻 · 今日 →

阿里语音大模型三项登顶：听准、听懂、会聊全面超 GPT-Realtime-2

Fun-Realtime-ASR + Fun-Realtime-AudioChat 在 Artificial Analysis 登顶 / 词错误率、语音推理、对话流畅度三项第一 / 超越 GPT-Realtime-2 / 已接入千问 App、高德地图、钉钉

语音赛道从"听得见"到"听得懂"的分水岭。阿里三项第一的意义不在奖牌，在场景：高德导航、钉钉会议纪要、千问实时对话——这些是语音模型商业化的真实出口，不是跑分游戏。

融资

Bloomberg / 每经 · 今日 →

Anthropic Q2 营收 109 亿美元首度盈利，算力成本骤降

Anthropic Q2 预计营收 109 亿美元（环比 +130%）/ 首次实现 5.59 亿运营利润 / 每美元营收算力成本从 71 美分降至 56 美分 / OpenAI Q1 营收 57 亿美元，年化收入 250 亿 / Anthropic 正洽谈使用微软 Maia 自研芯片

Anthropic 一个季度翻倍到 109 亿——这不是增长，是爆发。算力成本从 71 美分降到 56 美分说明规模效应开始兑现。但 OpenAI 和 Anthropic 都在冲刺 IPO，收入竞赛的背后是资本退出的倒计时。

SEC S-1 文件 · 今日 →

SpaceX 招股书曝光：Anthropic 三年 450 亿美元算力协议

SpaceX S-1 招股书披露 / Anthropic 每月支付 12.5 亿美元算力费用至 2029 年 5 月 / 三年合计近 450 亿美元 / 任意一方可提前 90 天终止 / 同时 AWS 千亿级芯片合作 + 谷歌 TPU + 微软 Maia 多线布局

450 亿美元只买算力——AI 行业的真实成本结构比外界想象的更惊人。Anthropic 同时下注 AWS、Google TPU、SpaceX、微软 Maia 四条算力管线，这不是选择困难症，是算力已经变成战略级供应链，任何单一供应商的断供都是致命风险。

推理优化

每日经济新闻 · 今日 →

智谱 ZCube 架构落地：不加一块 GPU，推理吞吐提升 15%

智谱联合驭驯网络与清华大学完成 ZCube 规模化落地 / 在 GLM-5.1 coding 场景中，GPU 算力和软件栈不变 / 节省 33% 交换机与光模块成本 / GPU 平均推理吞吐提升 15% / TTFT P99 降低 40.6%

不堆 GPU 也能涨 15% 吞吐——这不是免费午餐，是网络架构层面的结构性优化。33% 的交换机和光模块成本节省说明瓶颈从来不只是算力，互联和通信才是推理性能的隐藏天花板。

前沿技术

Frontier · GitHub & arXiv 周边

GitHub · 今日 →

hermes-agent：161K Stars，自进化 Agent 框架用 DSPy + GEPA 优化 Skills

NousResearch 出品 / GitHub 161,636 Stars（Trending #1）/ Agent 运行中持续吸收新能力、优化决策路径 / 基于 DSPy + GEPA 实现 Skills / Prompts / 代码的自我进化 / MCP 原生支持 / 今日 +2,056 Stars

不是更聪明的 Agent，是能变聪明的 Agent。hermes-agent 解决的不是"执行一步任务"，而是"持续学习、持续生长"。161K Stars 说明开发者的痛点已经从"怎么搭 Agent"变成了"怎么让 Agent 越用越好"。

GitHub · 今日 →

CLI-Anything：39K Stars，让所有软件变成 Agent-Native

HKUDS 出品 / GitHub 39,177 Stars（Trending #2）/ 核心理念：将任意 CLI 工具包装为 MCP 兼容的 Agent 接口 / CLI-Hub 统一注册和发现 / 今日 +656 Stars

如果每条 CLI 命令都能被 Agent 调用，那"工具集成"就从写 API 变成了加一行注册。CLI-Anything 本质是在做 Agent 生态的"适配层"——不需要重写软件，只需暴露 CLI 入口。39K Stars 证明开发者急需这条从旧工具到新 Agent 的桥梁。