AI 日报 · 2026-06-30

大模型

OpenAI GPT-5.6 三件套：Sol 跑 Cerebras 750 t/s，定价仅 Claude Fable 5 一半

Sol 旗舰 / Terra 均衡 / Luna 高性价比三档 / 7 月登陆 Cerebras 推理速度 750 tokens/秒（GPT-5.5 premium 15 倍）/ Terminal-Bench 2.1 SOTA / Sol 定价 5/30 美元每百万 token（仅为 Claude Fable 5 的一半）/ Ultra 模式调用子智能体并行 / 经 70 万 GPU 小时安全测试

OpenAI 罕见地一次发三款——但 Sol 现阶段只对约 20 家美国政府审批通过的客户开放，Sam Altman 内部邮件直言"这不是我们偏好的长期模式"。定价腰斩是更大的故事：把 Claude Fable 5 的输入价从 10 美元砸到 5 美元，前沿模型第一次走"白菜价"路线。问题是：政府审批从"事后报告"变成"事前介入"，发布节奏的控制权已经不在厂商手里了。

A G E N T

HP 新闻稿 · 2 天前 →

HP × OpenAI Frontier 战略合作：覆盖 170 国业务，员工+客服+研发全栈部署

2026-06-28 宣布 / OpenAI Frontier 平台全面接入 HP 业务 / 四大场景：客户体验 / WXP 遥测 / 员工效能 / 软件开发 / 2 月开始探索，6 月落地 / HP 自研 AI 智能体硬件（24×7 agentic 推理）

Frontier 第一个能讲清楚案例的世界 500 强客户来了——而且 HP 同时还做硬件：把 agentic AI 推理从"云端"压到"PC 上的专用硬件"。硬件+模型+智能体编排，三层全栈。这是 OpenAI 平台战略最想看到的样板间：不是 API 调用，而是一整个操作系统级别的渗透。

推理优化

科创板日报 · 3 天前 →

DeepSeek DSpark：梁文锋署名，首创"半自回归"推测解码，单用户生成提速 60-85%

2026-06-27 开源 / 梁文锋署名 + 北大联合发表 / 置信度调度推测解码（Confidence-Scheduled Speculative Decoding）/ V4-Flash 提速 60-85% / V4-Pro 提速 57-78% / 严格延迟约束下吞吐 +6.6 倍 / 同步开源 DeepSpec 全栈工具链（MIT 协议）

500 亿融资到账后第一个动作不是发新模型，而是"让旧模型跑更快"——DeepSeek 的算账逻辑相当清醒：把推理成本压到底，比堆参数更影响商业化。梁文锋亲自署名写论文，信号是：DeepSeek 的"省钱哲学"是公司战略级的。但更值得关注的是 DeepSpec 的 MIT 协议开源——等于把推测解码的工程模板免费送给整个行业。OpenAI 卖 5 美元/百万 token，DeepSeek 用"提速"换市场。

政策 · 安全

路透社 / 凤凰科技 · 3 天前 →

美政府 6-27 放行 Anthropic Mythos 5：100+ 财富 500 强企业获授权恢复访问

2026-06-12 因"潜在越狱"被美商务部紧急下架 / 6-27 路透社披露信函：已向 100+ 公司和机构恢复访问 / 商务部长 Lutnick 致信 Anthropic 确认合规 / 6-2 Project Glasswing 已扩至 150 家组织（15 国）/ Mythos 5 定价 10/50 美元每百万 token

两周前还"全球下架 90 分钟内完成合规"，两周后"100+ 500 强获授权"——Anthropic 这一回合把美国政府从"对手"谈成了"合作伙伴"。代价是：Mythos 5 变成事实上的"国家级专供"前沿模型，开源和商业分发路径被关上了大半。监管速度第一次跑赢发布节奏，但监管和厂商之间的谈判空间还在。下一个问题：Fable 5 什么时候能彻底恢复普通用户访问？

开源 · 多模态

Mistral AI 官方 · 7 天前 →

Mistral OCR 4：170 语种 + 结构化输出，OlmOCRBench 85.20，4 美元/千页

2026-06-23 发布 / 170 语种覆盖 10 语族 / 输出含边框、块类型、置信度评分 / OlmOCRBench 85.20 / OmniDocBench 93.07 / 人类评审 72% 胜率 / API 4 美元/千页（Batch 2 美元）/ 单容器可私有化部署

Mistral 把"OCR"从"读字"变成"读结构"——把文档智能的颗粒度从"段落"细化到"边框+类型+置信度"。4 美元/千页比 Azure Document Intelligence 便宜 7-15 倍，欧盟 AI 法案高风险义务 8 月生效前打出"主权部署"这张牌。但真正决定胜负的不是基准分数，是"企业能不能在不接触美国云的前提下跑通"——Mistral 的欧洲叙事比技术参数更值钱。

前沿技术

Frontier · GitHub & arXiv 周边

GitHub · 今日 · 25.7K Stars · +868 today →

cognee：Agent 长期记忆层，25.7K Stars，自托管知识图谱引擎

Agent 专用 AI 记忆平台 / 自托管知识图谱引擎 / 跨会话长期持久记忆 / MIT 协议 / 今日 +868 stars / 总 25,693 stars / Fork 2,364

RAG 的"半截子问题"是检索和生成的解耦：每答一次都要重新建索引、重新检索。cognee 走的是另一条路——把记忆直接做成"图谱层"挂在 Agent 下面，跨会话保留。从 LangChain 的向量检索到 cognee 的图谱记忆，Agent 基础设施从"检索"升级到"记忆"，这是 Agent 走向"长期工作伙伴"的必要拼图。今日热度印证了行业方向：谁先把记忆层做透，谁就拿下 Agent 时代的"数据库"卡位。

GitHub · 今日 · 1.2K Stars · +129 today →

VulnClaw：AI Agent + MCP 工具链全流程渗透测试自动化（自然语言 → 漏洞报告）

自然语言输入 → 信息收集→漏洞发现→漏洞利用→报告生成 / AI Agent 编排 + MCP 工具链 + 渗透 Skill / 今日 +129 stars / 总 1,180 stars / Python 实现

Cyber 攻防两端都被 AI 接管了——OpenAI 刚把 GPT-5.6 Sol 列为"高风险网络安全"模型，VulnClaw 直接在 GitHub 公开演示"AI 黑客"。MCP 工具链让 Agent 能调真正的渗透工具（nmap、metasploit 风格），自然语言成为攻击入口。这把"AI 安全"的讨论从"防 prompt 注入"拉到了"AI Agent 本身是攻击者"的新战场。