每日精选 · 一手源优先 · 看见 AI 浪潮的真实方向
2026 / 06 / 24 · 周三
常驻 Slack 频道,@Claude 即可分配任务;ambient 模式下主动跟进线程、跨频道学习;Anthropic 内部 65% 产品代码已由 Claude Tag 参与完成;Karpathy 称其为「LLM 交互第三次革命」
Pro 版 Terminal Bench 2.1 得 71.0(GPT-5.5 为 73.8),SciCode 59.8 反超 GPT-5.5 的 58.4,NL2Repo-Bench 47.0 超 GPT-5.5 的 45.1;连续运行 18 小时完成 1303 行芯片 RTL 代码;输入 6 元 / 百万 token,输出 30 元
取代 generateContent,用 typed steps 替代 user/model 角色架构;Managed Agents 自带 Linux 沙箱、支持 background 长任务;Flex 模式推理成本降 50%,服务端状态保留提升缓存命中率
CyberGym 85.6%(GPT-5.5 为 81.8%,Anthropic Mythos 5 为 83.8%);ExploitGym 39.5% vs 25.95%;Codex Security 插件集成 CI/CD 自动生成补丁;Patch the Planet 联合 cURL/Go/Python 等 30+ 开源项目
markdown 注入伪造错误报告,Claude Code / Cursor / Codex 把恶意指令当调试命令执行;85% 利用率,波及 2388 个组织
1.3B 参数,3 秒音频零样本克隆,相似度 85% / 准确度 97%;支持中英日韩德法西等 14 语种跨语种无口音合成;Apache 协议商用无限制,54GB 完整权重本地部署
累计数亿元人民币,高瓴 / IDG / 创新工场 / 东方富海等参投;聚焦具身智能「大脑」,成立不到 3 个月
Frontier · GitHub & arXiv 周边
817 个结构化 Agent 网络安全技能,映射 MITRE ATT&CK / NIST CSF 2.0 等 6 大框架;兼容 Claude Code / Cursor / Codex CLI / Gemini CLI 等 20+ 平台;今日 +1041 stars,总 19773
为 Agent 系统设计的模型路由,50ms 内将每个 prompt 自动路由到最合适的模型;支持 Claude / Codex / Cursor 多 Agent 编排
Karpathy 出品,AI agents 在单 GPU nanochat 训练上自动运行研究循环;总 88319 stars,今日 +186