AI 日报 · VOL·25 · 2026/06/22

A G E N T

Codex「录一遍就会」：演示一次，变可复用技能

macOS版Codex上线Record & Replay / 用户演示一次工作流，AI自动生成可复用Skill / 语义理解操作意图，非坐标录制 / 生成SKILL.md可编辑可共享 / 需Computer Use权限，EEA/UK/CH暂不可用

RPA行业做了二十年「录制回放」，死在坐标brittle上。Codex用LLM理解意图替代像素捕捉——从"录鼠标"到"录意图"，这是AI原生自动化的正确打开方式。但前提是你得信任AI操作你的电脑。

AWS 官方博客 · 本周 →

AWS一天发8款Agent新品：安全Agent + 知识图谱 + 自治桌面Agent

AgentCore正式GA，6个月Agent任务量增15倍 / AWS Continuum：AI原生安全服务，持续发现→验证→修复漏洞 / AWS Context：企业知识图谱，让Agent理解组织数据关系 / Amazon Quick自治Agent跨CRM/邮件/Slack自主工作 / Nasdaq/Visa/Experian已生产部署

AWS用8款产品一次填满Agent基础设施三大坑：安全（Continuum）、上下文（Context）、编排（AgentCore GA）。Amazon不做模型做水管——模型是通用的，但企业部署的安全/治理/数据接入是定制的，这恰好是AWS的生意。

大模型

WWDC 2026 · 今日 →

Apple WWDC 2026：Siri从底层重构，本地推理+Gemini云协作

Siri基于Apple Neural Engine从底层重写，大部分推理在设备端完成 / 与Google Gemini合作处理重量级生成任务 / 下一代ANE吞吐量提升10倍 / 端到端加密+差分隐私 / 企业API开放Siri自然语言理解+本地推理管道

Apple终于把Siri从"语音遥控器"升级为"本地AI平台"。与Gemini的合作模式很Apple：重活外包，隐私留家。但ANE 10倍吞吐才是关键——如果端侧推理真的跑得动，这才是对云端AI的真正威胁。

testingcatalog / 格隆汇 · 今日 →

GPT-5.6最快下周发布：150万上下文 + Agent能力全面强化

涵盖mini/标准/Pro三版 / 上下文窗口从100万扩展至约150万tokens（+43%）/ 词元效率再提升10-15% / 支持视觉复刻（设计稿→代码）/ SVG 3D对象生成 / Playwright浏览器自动化 / Polymarket给出89%发布概率

从5.4到5.5到5.6，OpenAI六周一更的节奏接近手机厂商的更新频率。150万上下文+Agent化是明确信号：GPT正从"聊天模型"往"可执行Agent"推。但Pro用户已在5.5里摸到5.6的影子——付费用户成了免费的测试队列。

开源

搜狐 · 今日 →

GLM-5.2正式开源，智谱盘中涨超40%，年内四次上调API定价

GLM-5.2全开源，权威评测全球第四 / 代码+百万长上下文对标国际顶尖 / 年内四次上调API定价，标志国产大模型拥有全球定价权 / 科创板IPO辅导验收+A+H双重上市预期 / 港股AI板块联动走强：长飞光纤+22%/MiniMax+13%

四次涨价还供不应求——智谱证明了国产大模型可以靠质量而非低价获得定价权。但同日摩根大通报告也提醒：快速降价和低转换成本可能压缩利润率，没有SOTA和workflow锁定，估值支撑会减弱。智谱的挑战是：涨价后的留存率。

融资

摩根大通 · 今日 →

摩根大通：中国大模型ARR今年增4-7倍，定价权是估值关键

中国AI采用早于全球同行 / 政策主导扩散+大规模基建创造追赶路径 / 核心挑战：货币化可持续性，快速降价+低转换成本压缩利润率 / 定价是估值溢价的最重要信号 / 维持智谱"增持"评级

摩通的逻辑很清晰：中国LLM的增长速度不缺，缺的是增长的含金量。ARR涨4-7倍听着惊人，但如果是靠API降价冲量，利润率会被反噬。定价权才是真正的护城河——能涨价的才值钱。

前沿技术

Frontier · GitHub & arXiv 周边

GitHub · 今日 →

headroom：LLM上下文压缩MCP，省60-95% Token，44.6K Stars

压缩CLI输出/日志/文件/RAG片段后再传入LLM / 60-95%更少Token，答案质量不变 / 支持库/代理/MCP三种模式 / 44,631 Stars，今日+2,624 / 开源Python

Token是Agent时代的油费。headroom做的不是压缩算法，而是在LLM和工具输出之间加了一层"语义过滤"——把对模型无益的格式噪声、重复行、ANSI码全砍掉。MCP接入意味着任何Agent框架都能用，这是基础设施级别的省钱工具。

GitHub · 今日 →

slime：清华开源LLM后训练RL框架，6.6K Stars

LLM后训练框架，专注RL Scaling / 支持GRPO/REINFORCE等RL算法 / 清华KEG实验室出品 / 6,620 Stars，今日+91 / 开源Python

RL Scaling正在成为后训练标配——从OpenAI的RLHF到DeepSeek的GRPO，强化学习是大模型从"能用"到"好用"的关键一跃。slime的开源降低了RL后训练门槛，让中小团队也能做自己的RL调优。

GitHub · 今日 →

deer-flow：字节跳动开源SuperAgent框架，72.6K Stars

长周期SuperAgent框架，可研究/编码/创作 / Sandbox+Memory+Tools+Skill+Subagents / Message Gateway多Agent通信 / 72,640 Stars，今日+442 / 开源Python

字节跳动的Agent框架思路与Codex不同：Codex是单Agent做深度，deer-flow是多Agent做广度——Sandbox隔离、Memory持久、Subagents分工。72K Stars说明社区对"长周期自治Agent"的渴望。但多Agent的调试和可观测性仍是未解难题。