VOL · 28

把今天的 AI
一杯咖啡读完

每日精选 · 一手源优先 · 看见 AI 浪潮的真实方向

2026 / 06 / 29 · 周一

A G E N T
OpenAI Workspace Agents
OpenAI 官方博客 · 今日

OpenAI 工作空间智能体在 ChatGPT 推出:Codex 驱动,跨团队共享

Codex 强力驱动的 GPT 进化形态 / 团队可创建共享智能体处理复杂任务和长期工作流 / 严格遵循组织权限管控 / 云端运行,离线状态也能持续执行 / 支持 ChatGPT Business / Enterprise / Edu / 教师版套餐研究预览 / ChatGPT 与 Slack 同步协作

GPT 在企业里的位置变了——从「个人助理」跨到「团队成员」。关键不在 Codex 本身(早就有),而是在 ChatGPT 原生集成 + 权限沙箱 + 跨人共享这套组合拳。微软 Copilot 一直是单人版,OpenAI 这步是把 AI Agent 推向真正的组织工作流,竞争维度从能力升级到治理结构。
大 模 型
Gemini 3.5 Flash
Google 官方博客 · 本周

Gemini 3.5 Flash 内置 computer use,4 倍速度反超 Pro

computer use 能力从独立模型内嵌至 3.5 Flash / OSWorld-Verified 跑分 78.4% / Antigravity 子智能体协同 / 击败 Gemini 3.1 Pro 的 agentic 任务 / 输出 tokens/秒 4 倍领先 / 浏览器、移动端、桌面系统全场景执行 / Gemini API + Enterprise Agent Platform + Browserbase demo

Flash 反超 Pro——Google 把「尺寸越大越强」的常规剧本反着写了一遍。computer use 内嵌到 Flash(最快最便宜的版本)等于把 Agent 能力的成本曲线打穿到地板:开发者部署成本能降一个量级。但安全警告也写明显了:直接操控企业系统等于把攻击面拉到屏幕级,prompt injection 防护是 Google 配套强化的核心。
The Block Beats · 本周

GPT-5.6 / Gemini 3.5 Pro 双双延期至 7 月,OpenAI Bidi 语音本周上线

GPT-5.6 由原定本周延至 7 月中旬 / Gemini 3.5 Pro 取消 6 月底发布计划(Google 内部对状态不满)/ 同步传出 Anthropic 已让部分企业客户提前接入 Claude Sonnet 5 / OpenAI 新一代双向语音模型 Bidi 在 ChatGPT 平台推进准备 / 15 天内新模型爆炸预测

四大模型同月发车的剧本落空,但延期背后是质量门槛在抬升。Google 主动取消 6 月底发布、Anthropic 把 Sonnet 5 给企业先验,方向都从「抢首发」转向「保口碑」。值得关注的是 Bidi——双向语音是 OpenAI 唯一明显落后于 Gemini Live 的赛道,赶在 GPT-5.6 前先上,是想用 Realtime API 拖住企业合同。
融 资
财联社 / 路透 · 3 日前

阿布扎比 MGX 募 500 亿美元,Menlo Ventures 30 亿,AI 资本池爆表

MGX 募资近 500 亿美元创年度最大 AI 投资基金纪录 / 首次以该规模向外部募资 / 投资组合覆盖 OpenAI 和 xAI / 与贝莱德、微软共同支持全球基础设施 / 目标资产管理规模 1000 亿美元以上 / 同步:Menlo Ventures 募 30 亿美元 ALL in AI(其历史最大基金)/ 已投 OpenRouter / Axiom / Skild AI / Anthropic 账面价值近 140 亿美元

主权基金和风投同周刷纪录——这不是常态,是 2026 年独有的资金供给曲线。MGX 把阿联酋从「资本输出」拉回「资本运作」,目标 1000 亿 AUM 比多数美国超大规模云厂商年资本开支都高。Menlo 投 Anthropic 一支赚 130 亿的故事,会刺激整个 VC 圈把赌注再加倍。问题:钱太多,项目不够分,估值泡沫会加速成型。
DeepSeek 融资
腾讯 / 路透 · 3 日前

DeepSeek 估值破 500 亿美元:梁文锋个人 30 亿 + 腾讯 + 宁德时代

DeepSeek 完成首轮融资,募资额约 70-74 亿美元 / 投后估值超 500 亿美元 / 创始人梁文锋个人出资 30 亿美元 / 腾讯、宁德时代参与 / 同步宣告大规模扩招应对全球 AI 加速 / 「Lean AI」策略被放弃,转向系统性建设

创始人个人 30 亿美金——这不是普通跟投,是把所有身家跟公司绑死。腾讯+宁德时代的组合也耐人寻味:腾讯补算力和云,宁德时代补能源(数据中心电力),把 DeepSeek 从「算法公司」拉成「AI 基建联合体」。500 亿估值对标 Mistral(60 亿)和 Anthropic(千亿级),性价比故事成立,但 Lean 路线彻底没了。
前 沿 技 术

Frontier · GitHub & arXiv 周边

HuggingFace Weekly Papers
Hugging Face Daily Papers · 昨日

HF 周报聚焦 Agentic AI:Qwen-AgentWorld + Wan-Streamer + PlanBench-XL

AK 周报精选 10 篇论文集中于 Agentic AI / 重点论文:Qwen-AgentWorld(阿里原生语言世界模型)/ Wan-Streamer v0.1(阿里实时流式交互基础模型)/ MemSlides(分层记忆 Agent 框架)/ PlanBench-XL(大规模工具调用规划评测)/ EnterpriseClawBench(企业级 Agent 评测)/ OpenRath(会话中心运行时状态)/ Grouped Query Experts(MoE on GQA)/ DataClaw0(多模态数据 Agent 精修)

从单点能力到系统集成——本周 Hugging Face Daily Papers 的关键词是「Agent 拼图」。Qwen-AgentWorld 把环境建模塞进预训练目标,Wan-Streamer 做实时流式响应,MemSlides 攻长上下文局部修订,三件套是 Agent 走向实用的基础。中文团队的产出在 Agent 研究里占比明显抬升,Qwen 系列继续是开源标杆。
codebase-memory-mcp
GitHub Trending · 今日 +2,190 ⭐

codebase-memory-mcp:158 语言代码库智能 MCP,单二进制零依赖

高性能代码智能 MCP 服务器 / 19,843 Stars / 今日 +2,190 Stars(Trending 第一)/ 把代码库索引为持久化知识图谱 / 平均 repo 索引毫秒级 / 毫秒级查询 / Token 用量减少 99% / 158 种语言 / 单一静态二进制 / 零运行时依赖

MCP 生态开始长出「基础设施层」——不是又一种 Agent 框架,而是 Agent 调用的底座。99% Token 削减是杀手锏:大 repo 喂给 Claude Code 不再被 context window 掐脖子。零依赖单二进制意味着能塞进任何 CI 流水线。对 Anthropic 推广 MCP 协议的整个生态来说,这是补完关键拼图。
ai-berkshire
GitHub Trending · 今日 +1,445 ⭐

ai-berkshire:四大师方法论 + 多 Agent 对抗,价值投资研究框架

基于 Claude Code / Codex 的价值投资研究框架 / 5,453 Stars / 今日 +1,445 Stars / 融合巴菲特、芒格、段永平、李录四位大师方法论 / 多 Agent 并行研究 + 对抗性分析 / 专为 AI 编程助手设计

把四位价值投资大师的方法论显式编码成 Agent Prompt——这不是新点子,但踩中了「个人量化」和「Claude Code 应用」两个流量交叉口。对抗性多 Agent 是亮点:让一个 Agent 当多头、一个当空头,互相挑战结论。问题是:价值投资的核心是对人性和商业模式的理解,多 Agent 模拟的「市场博弈」真能替代真金白银的持仓纪律?
browser-use video-use
GitHub Trending · 今日 +196 ⭐

video-use:编程 Agent 视频编辑框架,browser-use 兄弟项目

browser-use 团队新发布 / 11,135 Stars / 今日 +196 Stars / 通过编程 Agent(Claude Code)直接编辑视频 / 用代码指挥剪辑、特效、字幕、配乐全流程 / GitHub 持续 Trending

browser-use 把「用代码驱动浏览器」变成 Agent 标准范式,现在把同样思路搬到视频编辑——内容创作的最后一个堡垒。视频剪辑的核心是「多轨道时间线 + 状态机」,比浏览器 DOM 复杂,Agent 能稳定跑通才能进入实用。从 GitHub Trending 频次看,这是 2026 H2 第一个跨过「内容生产 Agent」门槛的框架。