VOL · 25

把今天的 AI
一杯咖啡读完

每日精选 · 一手源优先 · 看见 AI 浪潮的真实方向

2026 / 06 / 22 · 周日

A G E N T
Codex Record & Replay
OpenAI 官方文档 · 今日

Codex「录一遍就会」:演示一次,变可复用技能

macOS版Codex上线Record & Replay / 用户演示一次工作流,AI自动生成可复用Skill / 语义理解操作意图,非坐标录制 / 生成SKILL.md可编辑可共享 / 需Computer Use权限,EEA/UK/CH暂不可用

RPA行业做了二十年「录制回放」,死在坐标brittle上。Codex用LLM理解意图替代像素捕捉——从"录鼠标"到"录意图",这是AI原生自动化的正确打开方式。但前提是你得信任AI操作你的电脑。
AWS Summit NYC
AWS 官方博客 · 本周

AWS一天发8款Agent新品:安全Agent + 知识图谱 + 自治桌面Agent

AgentCore正式GA,6个月Agent任务量增15倍 / AWS Continuum:AI原生安全服务,持续发现→验证→修复漏洞 / AWS Context:企业知识图谱,让Agent理解组织数据关系 / Amazon Quick自治Agent跨CRM/邮件/Slack自主工作 / Nasdaq/Visa/Experian已生产部署

AWS用8款产品一次填满Agent基础设施三大坑:安全(Continuum)、上下文(Context)、编排(AgentCore GA)。Amazon不做模型做水管——模型是通用的,但企业部署的安全/治理/数据接入是定制的,这恰好是AWS的生意。
大 模 型
Apple WWDC 2026
WWDC 2026 · 今日

Apple WWDC 2026:Siri从底层重构,本地推理+Gemini云协作

Siri基于Apple Neural Engine从底层重写,大部分推理在设备端完成 / 与Google Gemini合作处理重量级生成任务 / 下一代ANE吞吐量提升10倍 / 端到端加密+差分隐私 / 企业API开放Siri自然语言理解+本地推理管道

Apple终于把Siri从"语音遥控器"升级为"本地AI平台"。与Gemini的合作模式很Apple:重活外包,隐私留家。但ANE 10倍吞吐才是关键——如果端侧推理真的跑得动,这才是对云端AI的真正威胁。
testingcatalog / 格隆汇 · 今日

GPT-5.6最快下周发布:150万上下文 + Agent能力全面强化

涵盖mini/标准/Pro三版 / 上下文窗口从100万扩展至约150万tokens(+43%)/ 词元效率再提升10-15% / 支持视觉复刻(设计稿→代码)/ SVG 3D对象生成 / Playwright浏览器自动化 / Polymarket给出89%发布概率

从5.4到5.5到5.6,OpenAI六周一更的节奏接近手机厂商的更新频率。150万上下文+Agent化是明确信号:GPT正从"聊天模型"往"可执行Agent"推。但Pro用户已在5.5里摸到5.6的影子——付费用户成了免费的测试队列。
开 源
GLM-5.2
搜狐 · 今日

GLM-5.2正式开源,智谱盘中涨超40%,年内四次上调API定价

GLM-5.2全开源,权威评测全球第四 / 代码+百万长上下文对标国际顶尖 / 年内四次上调API定价,标志国产大模型拥有全球定价权 / 科创板IPO辅导验收+A+H双重上市预期 / 港股AI板块联动走强:长飞光纤+22%/MiniMax+13%

四次涨价还供不应求——智谱证明了国产大模型可以靠质量而非低价获得定价权。但同日摩根大通报告也提醒:快速降价和低转换成本可能压缩利润率,没有SOTA和workflow锁定,估值支撑会减弱。智谱的挑战是:涨价后的留存率。
融 资
JPMorgan China LLM
摩根大通 · 今日

摩根大通:中国大模型ARR今年增4-7倍,定价权是估值关键

中国AI采用早于全球同行 / 政策主导扩散+大规模基建创造追赶路径 / 核心挑战:货币化可持续性,快速降价+低转换成本压缩利润率 / 定价是估值溢价的最重要信号 / 维持智谱"增持"评级

摩通的逻辑很清晰:中国LLM的增长速度不缺,缺的是增长的含金量。ARR涨4-7倍听着惊人,但如果是靠API降价冲量,利润率会被反噬。定价权才是真正的护城河——能涨价的才值钱。
前 沿 技 术

Frontier · GitHub & arXiv 周边

headroom
GitHub · 今日

headroom:LLM上下文压缩MCP,省60-95% Token,44.6K Stars

压缩CLI输出/日志/文件/RAG片段后再传入LLM / 60-95%更少Token,答案质量不变 / 支持库/代理/MCP三种模式 / 44,631 Stars,今日+2,624 / 开源Python

Token是Agent时代的油费。headroom做的不是压缩算法,而是在LLM和工具输出之间加了一层"语义过滤"——把对模型无益的格式噪声、重复行、ANSI码全砍掉。MCP接入意味着任何Agent框架都能用,这是基础设施级别的省钱工具。
slime
GitHub · 今日

slime:清华开源LLM后训练RL框架,6.6K Stars

LLM后训练框架,专注RL Scaling / 支持GRPO/REINFORCE等RL算法 / 清华KEG实验室出品 / 6,620 Stars,今日+91 / 开源Python

RL Scaling正在成为后训练标配——从OpenAI的RLHF到DeepSeek的GRPO,强化学习是大模型从"能用"到"好用"的关键一跃。slime的开源降低了RL后训练门槛,让中小团队也能做自己的RL调优。
deer-flow
GitHub · 今日

deer-flow:字节跳动开源SuperAgent框架,72.6K Stars

长周期SuperAgent框架,可研究/编码/创作 / Sandbox+Memory+Tools+Skill+Subagents / Message Gateway多Agent通信 / 72,640 Stars,今日+442 / 开源Python

字节跳动的Agent框架思路与Codex不同:Codex是单Agent做深度,deer-flow是多Agent做广度——Sandbox隔离、Memory持久、Subagents分工。72K Stars说明社区对"长周期自治Agent"的渴望。但多Agent的调试和可观测性仍是未解难题。