VOL · 29

把今天的 AI
一杯咖啡读完

每日精选 · 一手源优先 · 看见 AI 浪潮的真实方向

2026 / 06 / 30 · 周二

大 模 型
GPT-5.6
OpenAI 社区 · 4 天前

OpenAI GPT-5.6 三件套:Sol 跑 Cerebras 750 t/s,定价仅 Claude Fable 5 一半

Sol 旗舰 / Terra 均衡 / Luna 高性价比三档 / 7 月登陆 Cerebras 推理速度 750 tokens/秒(GPT-5.5 premium 15 倍)/ Terminal-Bench 2.1 SOTA / Sol 定价 5/30 美元每百万 token(仅为 Claude Fable 5 的一半)/ Ultra 模式调用子智能体并行 / 经 70 万 GPU 小时安全测试

OpenAI 罕见地一次发三款——但 Sol 现阶段只对约 20 家美国政府审批通过的客户开放,Sam Altman 内部邮件直言"这不是我们偏好的长期模式"。定价腰斩是更大的故事:把 Claude Fable 5 的输入价从 10 美元砸到 5 美元,前沿模型第一次走"白菜价"路线。问题是:政府审批从"事后报告"变成"事前介入",发布节奏的控制权已经不在厂商手里了。
A G E N T
HP × OpenAI
HP 新闻稿 · 2 天前

HP × OpenAI Frontier 战略合作:覆盖 170 国业务,员工+客服+研发全栈部署

2026-06-28 宣布 / OpenAI Frontier 平台全面接入 HP 业务 / 四大场景:客户体验 / WXP 遥测 / 员工效能 / 软件开发 / 2 月开始探索,6 月落地 / HP 自研 AI 智能体硬件(24×7 agentic 推理)

Frontier 第一个能讲清楚案例的世界 500 强客户来了——而且 HP 同时还做硬件:把 agentic AI 推理从"云端"压到"PC 上的专用硬件"。硬件+模型+智能体编排,三层全栈。这是 OpenAI 平台战略最想看到的样板间:不是 API 调用,而是一整个操作系统级别的渗透。
推 理 优 化
DeepSeek DSpark
科创板日报 · 3 天前

DeepSeek DSpark:梁文锋署名,首创"半自回归"推测解码,单用户生成提速 60-85%

2026-06-27 开源 / 梁文锋署名 + 北大联合发表 / 置信度调度推测解码(Confidence-Scheduled Speculative Decoding)/ V4-Flash 提速 60-85% / V4-Pro 提速 57-78% / 严格延迟约束下吞吐 +6.6 倍 / 同步开源 DeepSpec 全栈工具链(MIT 协议)

500 亿融资到账后第一个动作不是发新模型,而是"让旧模型跑更快"——DeepSeek 的算账逻辑相当清醒:把推理成本压到底,比堆参数更影响商业化。梁文锋亲自署名写论文,信号是:DeepSeek 的"省钱哲学"是公司战略级的。但更值得关注的是 DeepSpec 的 MIT 协议开源——等于把推测解码的工程模板免费送给整个行业。OpenAI 卖 5 美元/百万 token,DeepSeek 用"提速"换市场。
政 策 · 安 全
Anthropic Mythos 5
路透社 / 凤凰科技 · 3 天前

美政府 6-27 放行 Anthropic Mythos 5:100+ 财富 500 强企业获授权恢复访问

2026-06-12 因"潜在越狱"被美商务部紧急下架 / 6-27 路透社披露信函:已向 100+ 公司和机构恢复访问 / 商务部长 Lutnick 致信 Anthropic 确认合规 / 6-2 Project Glasswing 已扩至 150 家组织(15 国)/ Mythos 5 定价 10/50 美元每百万 token

两周前还"全球下架 90 分钟内完成合规",两周后"100+ 500 强获授权"——Anthropic 这一回合把美国政府从"对手"谈成了"合作伙伴"。代价是:Mythos 5 变成事实上的"国家级专供"前沿模型,开源和商业分发路径被关上了大半。监管速度第一次跑赢发布节奏,但监管和厂商之间的谈判空间还在。下一个问题:Fable 5 什么时候能彻底恢复普通用户访问?
开 源 · 多 模 态
Mistral AI 官方 · 7 天前

Mistral OCR 4:170 语种 + 结构化输出,OlmOCRBench 85.20,4 美元/千页

2026-06-23 发布 / 170 语种覆盖 10 语族 / 输出含边框、块类型、置信度评分 / OlmOCRBench 85.20 / OmniDocBench 93.07 / 人类评审 72% 胜率 / API 4 美元/千页(Batch 2 美元)/ 单容器可私有化部署

Mistral 把"OCR"从"读字"变成"读结构"——把文档智能的颗粒度从"段落"细化到"边框+类型+置信度"。4 美元/千页比 Azure Document Intelligence 便宜 7-15 倍,欧盟 AI 法案高风险义务 8 月生效前打出"主权部署"这张牌。但真正决定胜负的不是基准分数,是"企业能不能在不接触美国云的前提下跑通"——Mistral 的欧洲叙事比技术参数更值钱。
前 沿 技 术

Frontier · GitHub & arXiv 周边

cognee
GitHub · 今日 · 25.7K Stars · +868 today

cognee:Agent 长期记忆层,25.7K Stars,自托管知识图谱引擎

Agent 专用 AI 记忆平台 / 自托管知识图谱引擎 / 跨会话长期持久记忆 / MIT 协议 / 今日 +868 stars / 总 25,693 stars / Fork 2,364

RAG 的"半截子问题"是检索和生成的解耦:每答一次都要重新建索引、重新检索。cognee 走的是另一条路——把记忆直接做成"图谱层"挂在 Agent 下面,跨会话保留。从 LangChain 的向量检索到 cognee 的图谱记忆,Agent 基础设施从"检索"升级到"记忆",这是 Agent 走向"长期工作伙伴"的必要拼图。今日热度印证了行业方向:谁先把记忆层做透,谁就拿下 Agent 时代的"数据库"卡位。
VulnClaw
GitHub · 今日 · 1.2K Stars · +129 today

VulnClaw:AI Agent + MCP 工具链全流程渗透测试自动化(自然语言 → 漏洞报告)

自然语言输入 → 信息收集→漏洞发现→漏洞利用→报告生成 / AI Agent 编排 + MCP 工具链 + 渗透 Skill / 今日 +129 stars / 总 1,180 stars / Python 实现

Cyber 攻防两端都被 AI 接管了——OpenAI 刚把 GPT-5.6 Sol 列为"高风险网络安全"模型,VulnClaw 直接在 GitHub 公开演示"AI 黑客"。MCP 工具链让 Agent 能调真正的渗透工具(nmap、metasploit 风格),自然语言成为攻击入口。这把"AI 安全"的讨论从"防 prompt 注入"拉到了"AI Agent 本身是攻击者"的新战场。