VOL · 22

把今天的 AI
一杯咖啡读完

每日精选 · 一手源优先 · 看见 AI 浪潮的真实方向

2026 / 06 / 16 · 周二

开 源
GLM-5.2
智谱官方 · 今日

GLM-5.2:1M 上下文 MIT 开源旗舰,Fable 5 下线后的国产回应

744B MoE 架构 / 1M tokens 上下文 / 131K 最大输出 / High·Max 双思考强度 / MIT 协议开源 / 中金测评:国模首达 Opus 4.6 水平 / 智谱两日股价涨幅 35%+

Fable 5 被管制的 48 小时内,智谱精准卡位:不拼参数规模,打长上下文+开源两张牌。MIT 协议是最激进的开源态度——不是 Apache 2.0 的「开一半」,是「全开」。但零 Benchmark 发布是双刃剑:让开发者自己跑分是自信还是心虚,下周社区出结果就见分晓。
融 资
Salesforce Fin
Salesforce 官方 / TechCrunch · 今日

Salesforce 36 亿美元收购 Fin,AI Agent 最大收购案落地

36 亿美元收购 Fin(原 Intercom)/ AI Agent 跨渠道自主解决 76% 客服工单 / Agentforce ARR 12 亿美元同比增 205% / 预计 FY27 Q4 完成交割 / 3 万企业客户并入

36 亿美元买一个客服 Agent——这笔账算的不是技术,是分发。Salesforce 有 29,000 笔 Agentforce 交易,Fin 有 30,000 家企业客户,合在一起就是最大的 Agent 分发网络。真正值得细品的是定价:Agent 按解决量计费,不是按坐席。商业模式从 SaaS 订阅走向使用量付费,AI Agent 经济的第一块多米诺骨牌。
A G E N T
Meta AI Mode
Meta 官方博客 · 今日

Facebook 上线 AI Mode:20 亿用户的内容变为 AI 搜索语料

AI Mode 替换 Facebook 传统搜索 / Muse Spark 驱动 / 自动合成 Groups+Reels+Instagram+Threads 公开帖子回答问题 / 无 Opt-out 机制 / 20 亿日活用户无通知 / 仅美国上线

Meta 的打法一如既往:先上线,再道歉。20 亿用户的公开帖子一夜之间变成 AI 搜索数据,没有退出选项,没有提前通知。Muse Spark 的 API 还拖着没发布,但 Facebook 搜索已经先用上了——开发者等了两个月的 API,不如自家产品优先级高。搜索广告是千亿美元市场,这才是 Meta 真正的靶心。
大 模 型
OpenAI 官方 · 今日

OpenAI 1.5 亿美元建合作伙伴网络,年底认证 30 万顾问

1.5 亿美元投入全球合作伙伴网络 / Select·Advanced·Elite 三级认证 / Codex+网络安全+Agent 三大专业方向 / Accenture·Bain·BCG·McKinsey·PwC 首批 / 前沿部署专家试点 / 2026 年底培训 30 万认证顾问

OpenAI 诊断得很准:模型能力已经不是企业落地的瓶颈,用例选择、工作流重构、变革管理才是。1.5 亿美元砸向咨询生态,本质是把 Anthropic 的企业直销优势用渠道战来对冲。但咨询公司两头吃是行业常态——今天卖 OpenAI,明天卖 Anthropic,最终客户关系握在谁手里?
安 全
Pliny the Liberator / GitHub · 今日

Fable 5 遭多 Agent 协同越狱,12 万字系统提示词泄露

安全研究员 Pliny 发起「Pack Hunt」多 Agent 协同攻击 / 将有害请求拆解为无害子问题分发至并行 Agent 实例 / Unicode+同形字+西里尔字母替换规避检测 / 重组输出绕过 Fable 5 安全分类器 / 同步公开 120,000 字符系统提示词(Mythos 级模型首次泄露)

从单提示注入到多 Agent 协同攻击——攻击面发生质变。12 万字系统提示词的泄露更致命:它揭示 Anthropic 安全架构高度依赖自然语言护栏而非硬编码拒绝逻辑,等于给对手画了一张完整的攻防地图。Fable 5 刚被出口管制下线,又被越狱打穿,Anthropic 这一周的安全叙事完全失控。
政 策
财联社 / OpenAI · 今日

OpenAI 承诺 2026 年投入 5000 万美元 AI 非营利项目

OpenAI 承诺 2026 年投入 5000 万美元于 AI 相关非营利问题 / 正值多州检察长调查 ChatGPT 用户安全 / IPO 前夜社会责任牌 / 纽约州传票要求广告业务+用户数据+内部政策等资料

5000 万美元对 OpenAI 是什么概念?不到一个月的咖啡预算。但时间点很微妙:纽约州传票刚到,IPO 正在路上,这笔钱更像是监管公关的预付款而非真正的社会责任。AI 公司的「负责任」叙事正在从「我们自己对齐」转向「我们给社会付钱」,本质都是同一件事——用最小成本换取最大信任。
前 沿 技 术

Frontier · GitHub & arXiv 周边

SkillSpector
GitHub · 今日

SkillSpector:NVIDIA 出品 Agent 技能安全扫描器,6,427 Stars

NVIDIA 官方出品 / 安全扫描 AI Agent 技能漏洞 / 检测恶意模式+安全风险 / 6,427 Stars / +1,079/日 Trending / Python 开源

NVIDIA 做 Agent 安全扫描器,信号很明确:Agent 生态的安全问题已从「研究课题」升级为「产业需求」。73 个恶意 npm 包伏击 AI Agent 的事件刚过,NVIDIA 就出手做检测工具——这不是慈善,是 Agent 基础设施的必选项。当 Agent 可以自主安装和执行技能时,安全扫描就是免疫系统。
CUA
GitHub · 本周

CUA:Computer-Use Agent 开源基础设施,18K Stars 全平台沙箱

开源 Computer-Use Agent 基础设施 / 沙箱+SDK+Benchmark / macOS+Linux+Windows 全平台桌面控制 / 训练+评估 AI Agent 控制完整桌面 / 18,183 Stars / Python+HTML

Computer Use 是 Agent 赛道最硬核也最危险的方向——让 AI 控制完整桌面意味着极高的权限和风险。CUA 的价值在于提供了标准化的沙箱和评估框架,把「AI 控制电脑」从 demo 推向工程化。跨平台三系统支持是亮点,但安全边界怎么划,比技术实现更难。
MLEvolve
arXiv / GitHub · 本周

MLEvolve:自进化多 Agent 框架,MLE-Bench SOTA 超越 AlphaEvolve

LLM 驱动自进化多 Agent 框架 / Progressive MCGS 跨分支信息流 / Retrospective Memory 冷启动+动态全局记忆 / 自适应编码模式解耦策略规划与代码生成 / MLE-Bench 12h 预算 SOTA / 超越 AlphaEvolve 数学算法优化 / 跨域泛化

AlphaEvolve 用进化搜索做数学,MLEvolve 用多 Agent 自进化做 ML——底层逻辑一样:让 AI 自己改进自己。关键差异在于 Retrospective Memory,让 Agent 从历史经验中学习而不是每次从零开始。从「无记忆搜索」到「有记忆的进化」,这是 Agent 自改进的必经之路。