VOL · 19

把今天的 AI
一杯咖啡读完

每日精选 · 一手源优先 · 看见 AI 浪潮的真实方向

2026 / 06 / 11 · 周三

大 模 型
OpenAI Price War
华尔街日报 · 今日

OpenAI 拟大幅降价狙击 Anthropic,AI 服务价格战正式开打

WSJ 报道 OpenAI 正考虑大幅下调 Token 收费标准 / Altman 称 AI 成本是"巨大问题" / 两家均亏损数十亿美元 / Anthropic Claude Code 走红后估值首超 OpenAI / Codex 成 OpenAI 重点方向

两家 IPO 前夜打价格战,烧的是 VC 的钱,争的是企业客户的锁定。编程工具已成两强角力核心战场。但降价只是入口,留住客户靠的是工作流嵌入深度——谁先把 Agent 织进企业日常,谁就赢了这一轮。
A G E N T
Yahoo Finance · 今日

Visa 支付网络接入 ChatGPT,AI 代理可替用户完成购物付款

Visa 支付网络嵌入 ChatGPT / AI 代理可独立完成选购+交易 / 覆盖所有 Visa 商户 / 用户可设消费上限+商户类别限制+购买审批 / Visa 负责授权+欺诈监测 / OpenAI 负责 AI 交互+决策

AI 从"帮你找"到"帮你买"——支付网络的信任背书是关键拼图。上次 Instant Checkout 因 4% 手续费和交易错误率被商户抵制下线,这次 Visa 亲自做风控。AI 支付的瓶颈不在技术,在信任链。
阿里官方 · 今日

阿里千问发布国内首个全周期高考志愿填报 Agent

国内首个全周期高考志愿填报 Agent / 艾媒咨询预计 2026 年市场付费规模 11.6 亿元 / 美的+阿里"全屋智能+AI 大模型"合作 / 微信官宣朋友圈搜索 / 阿里云 ACS Agent Sandbox 降价

高考志愿填报是 AI Agent 垂直场景的天然试验田——数据结构化、决策路径明确、用户付费意愿强。11.6 亿市场规模不大,但作为 Agent 商业化的敲门砖,教育场景的复用性比想象中高。
融 资
OpenAI Ohio Datacenter
The Information · 今日

OpenAI 租赁 10GW 俄亥俄数据中心,NVIDIA 罕见提供财务担保

10 吉瓦数据中心园区 / 20 年租约 / NVIDIA 为租约+项目融资提供担保 / 总投入至少 5000 亿美元 / 首期 800MW 2028 年投产 / 软银 SB Energy 开发 / 选址前铀浓缩设施

NVIDIA 从卖芯片到给租约做担保——供应商变成金融后盾,算力经济的风险结构已经变了。5000 亿美元的赌注押在 AI 需求只增不减上,但胡佛大坝 4.5 倍的电力消耗本身就是一个能源问题。
开 源
MiMo Code
小米官方 · 今日

小米开源 MiMo Code V0.1:终端 AI 编程助手,独创持久记忆系统

基于 OpenCode 二次开发 / MIT 协议 / 内置 MiMo-V2.5 多模态模型(比肩 Sonnet 4.6)/ 持久记忆三重机制(项目记忆+会话检查点+任务进度)/ Compose 模式 1→12 协同 / 支持 DeepSeek / Kimi / GLM / 7 天自动 /dream 记忆整理

小米做终端 AI 编程工具,逻辑跟做手机一样:硬件入口→软件生态→用户锁定。持久记忆系统解决了长会话失忆的行业痛点。但 Claude Code 和 Codex 已建立开发者习惯,小米需要靠 MIT 协议+免费模型抢占长尾市场。
政 策
Anthropic Policy
Anthropic 官方 · 今日

Amodei 呼吁 FAA 式 AI 监管:政府应有权阻止危险模型部署

Dario Amodei 发布"Policy on the AI Exponential" / 政府应有法律权限阻止危险 AI 部署 / 10²⁵ FLOPs 阈值+5 亿美元 AI 收入门槛 / 四大风险(生物/网络/失控/自动化 R&D)/ 民事处罚按全球年收入比例递增 / Mythos Preview 已发现数千个高严重性漏洞

Anthropic 提监管框架的时机耐人寻味——Fable 5 刚发布,Mythos 级别的网络安全能力就是最好的"为什么需要监管"论据。但行业一定会质疑:你自己的模型刚展示了超强攻防能力,转头就呼吁政府限制别人,这是既当选手又当裁判?
前 沿 技 术

Frontier · GitHub & arXiv 周边

DiffusionGemma
Google DeepMind · 今日

DiffusionGemma:扩散模型生成文本,本地推理 4 倍加速

26B MoE 仅 3.8B 激活 / 每次前向传播并行生成 256 tokens / 单 H100 上 1000+ tok/s / RTX 5090 上 700+ tok/s / Apache 2.0 / 双向注意力+自纠错 / 18GB 显存可运行 / 整体质量低于标准 Gemma 4

扩散模型从图像走到文本,本质是把"打字机"换成了"印刷机"——不是逐字吐出而是整段并行去噪。1000+ tok/s 对本地 Agent 循环是质变。但 Google 自己也承认质量低于标准 Gemma 4,架构创新和输出质量之间还有硬折中。
HRM-Text
arXiv · 本周

HRM-Text:1B 参数跑出 7B 水平,$1500 从零预训练

Sapient Intelligence 发布 / 1B 参数 / MATH 56.2 / GSM8K 84.5 / ARC-C 81.9 / 16×H100 不到 2 天 / $1500 / 高层+低层双模块循环 8 轮 / 有效计算深度 ×8 / 仅用 40B unique tokens(同规模模型 1/225)/ 图灵奖得主背书

1B 参数跑出 7B 水平的数学推理且是纯预训练——HRM-Text 证明"更大模型"不是唯一路径。核心创新是让有限参数在输出前多轮内部迭代,用时间换空间。但作为 Proof of Concept,距离生产级还有相当距离。
OpenSquilla
GitHub · 今日

OpenSquilla:微内核 AI Agent 框架,长程工作流 Token 成本降 89%

微内核架构 / 智能模型路由 / 25 个混合任务 $6.2→$0.68(成本降 89%)/ 支持 20+ LLM 提供商 / Meta Skill 机制 / 今日 GitHub Trending +1200 Stars / 支持 Ollama 本地部署

Agent 框架的 Token 成本是落地最大障碍之一。OpenSquilla 用微内核+智能路由把多工具调用压缩到单一循环,89% 成本降幅非常有吸引力。但 2000+ Stars 说明还在早期,企业级可靠性需要验证。