AI 日报 · 2026/06/11

大模型

OpenAI 拟大幅降价狙击 Anthropic，AI 服务价格战正式开打

WSJ 报道 OpenAI 正考虑大幅下调 Token 收费标准 / Altman 称 AI 成本是"巨大问题" / 两家均亏损数十亿美元 / Anthropic Claude Code 走红后估值首超 OpenAI / Codex 成 OpenAI 重点方向

两家 IPO 前夜打价格战，烧的是 VC 的钱，争的是企业客户的锁定。编程工具已成两强角力核心战场。但降价只是入口，留住客户靠的是工作流嵌入深度——谁先把 Agent 织进企业日常，谁就赢了这一轮。

A G E N T

Yahoo Finance · 今日 →

Visa 支付网络接入 ChatGPT，AI 代理可替用户完成购物付款

Visa 支付网络嵌入 ChatGPT / AI 代理可独立完成选购+交易 / 覆盖所有 Visa 商户 / 用户可设消费上限+商户类别限制+购买审批 / Visa 负责授权+欺诈监测 / OpenAI 负责 AI 交互+决策

AI 从"帮你找"到"帮你买"——支付网络的信任背书是关键拼图。上次 Instant Checkout 因 4% 手续费和交易错误率被商户抵制下线，这次 Visa 亲自做风控。AI 支付的瓶颈不在技术，在信任链。

阿里官方 · 今日 →

阿里千问发布国内首个全周期高考志愿填报 Agent

国内首个全周期高考志愿填报 Agent / 艾媒咨询预计 2026 年市场付费规模 11.6 亿元 / 美的+阿里"全屋智能+AI 大模型"合作 / 微信官宣朋友圈搜索 / 阿里云 ACS Agent Sandbox 降价

高考志愿填报是 AI Agent 垂直场景的天然试验田——数据结构化、决策路径明确、用户付费意愿强。11.6 亿市场规模不大，但作为 Agent 商业化的敲门砖，教育场景的复用性比想象中高。

融资

The Information · 今日 →

OpenAI 租赁 10GW 俄亥俄数据中心，NVIDIA 罕见提供财务担保

10 吉瓦数据中心园区 / 20 年租约 / NVIDIA 为租约+项目融资提供担保 / 总投入至少 5000 亿美元 / 首期 800MW 2028 年投产 / 软银 SB Energy 开发 / 选址前铀浓缩设施

NVIDIA 从卖芯片到给租约做担保——供应商变成金融后盾，算力经济的风险结构已经变了。5000 亿美元的赌注押在 AI 需求只增不减上，但胡佛大坝 4.5 倍的电力消耗本身就是一个能源问题。

开源

小米官方 · 今日 →

小米开源 MiMo Code V0.1：终端 AI 编程助手，独创持久记忆系统

基于 OpenCode 二次开发 / MIT 协议 / 内置 MiMo-V2.5 多模态模型（比肩 Sonnet 4.6）/ 持久记忆三重机制（项目记忆+会话检查点+任务进度）/ Compose 模式 1→12 协同 / 支持 DeepSeek / Kimi / GLM / 7 天自动 /dream 记忆整理

小米做终端 AI 编程工具，逻辑跟做手机一样：硬件入口→软件生态→用户锁定。持久记忆系统解决了长会话失忆的行业痛点。但 Claude Code 和 Codex 已建立开发者习惯，小米需要靠 MIT 协议+免费模型抢占长尾市场。

政策

Anthropic 官方 · 今日 →

Amodei 呼吁 FAA 式 AI 监管：政府应有权阻止危险模型部署

Dario Amodei 发布"Policy on the AI Exponential" / 政府应有法律权限阻止危险 AI 部署 / 10²⁵ FLOPs 阈值+5 亿美元 AI 收入门槛 / 四大风险（生物/网络/失控/自动化 R&D）/ 民事处罚按全球年收入比例递增 / Mythos Preview 已发现数千个高严重性漏洞

Anthropic 提监管框架的时机耐人寻味——Fable 5 刚发布，Mythos 级别的网络安全能力就是最好的"为什么需要监管"论据。但行业一定会质疑：你自己的模型刚展示了超强攻防能力，转头就呼吁政府限制别人，这是既当选手又当裁判？

前沿技术

Frontier · GitHub & arXiv 周边

Google DeepMind · 今日 →

DiffusionGemma：扩散模型生成文本，本地推理 4 倍加速

26B MoE 仅 3.8B 激活 / 每次前向传播并行生成 256 tokens / 单 H100 上 1000+ tok/s / RTX 5090 上 700+ tok/s / Apache 2.0 / 双向注意力+自纠错 / 18GB 显存可运行 / 整体质量低于标准 Gemma 4

扩散模型从图像走到文本，本质是把"打字机"换成了"印刷机"——不是逐字吐出而是整段并行去噪。1000+ tok/s 对本地 Agent 循环是质变。但 Google 自己也承认质量低于标准 Gemma 4，架构创新和输出质量之间还有硬折中。

arXiv · 本周 →

HRM-Text：1B 参数跑出 7B 水平，$1500 从零预训练

Sapient Intelligence 发布 / 1B 参数 / MATH 56.2 / GSM8K 84.5 / ARC-C 81.9 / 16×H100 不到 2 天 / $1500 / 高层+低层双模块循环 8 轮 / 有效计算深度 ×8 / 仅用 40B unique tokens（同规模模型 1/225）/ 图灵奖得主背书

1B 参数跑出 7B 水平的数学推理且是纯预训练——HRM-Text 证明"更大模型"不是唯一路径。核心创新是让有限参数在输出前多轮内部迭代，用时间换空间。但作为 Proof of Concept，距离生产级还有相当距离。

GitHub · 今日 →

OpenSquilla：微内核 AI Agent 框架，长程工作流 Token 成本降 89%

微内核架构 / 智能模型路由 / 25 个混合任务 $6.2→$0.68（成本降 89%）/ 支持 20+ LLM 提供商 / Meta Skill 机制 / 今日 GitHub Trending +1200 Stars / 支持 Ollama 本地部署

Agent 框架的 Token 成本是落地最大障碍之一。OpenSquilla 用微内核+智能路由把多工具调用压缩到单一循环，89% 成本降幅非常有吸引力。但 2000+ Stars 说明还在早期，企业级可靠性需要验证。