每日精选 · 一手源优先 · 看见 AI 浪潮的真实方向
2026 / 05 / 27 · 周二
Gemini 驱动4层智能体架构(LLM + Lean形式化验证 + 进化算法) / 353个Erdős开放问题中解决9个 / OEIS 44个猜想获证 / 每题推理成本仅数百美元 / 证明代码全开源GitHub
视频出席澳大利亚联邦银行悉尼会议 / "我原以为AI会淘汰更多初级白领职位,但实际并未发生" / 尝试用AI代回Slack和邮件,AI回复"这是Sam的AI"后深感人类互动不可替代 / "不会出现业内部分公司所鼓吹的就业末日"
CodeArena 得分1541全球第二(仅次于Claude) / 可持续运行35小时 + 1000次工具调用 / QwenCloud 海外官网 + Agent产品MuleRun + Qoder编程平台 + QoderWork桌面智能体 / 阿里云CTO李飞飞:Agent爆发让模型调用量指数级增长
3亿笔AI智能体支付 / 支持95%通用智能体框架(千问 / Claude Code / Hermes Agent等) / 全球首个TokenPay服务 + AI钱包 / AI付 + AI收 + TokenPay + AI钱包四件套 / MiniMax、阶跃星辰深度合作
AA-Index得分17.9超越所有2B以下模型 / INT4量化后仅0.5GB / MMLU-Pro 48.85 / MATH-500 91.60 / LCB-Pro 22.68 / 自研ForgeTrain AI训练框架 / 权重 + 数据集 + 部署方案全开源
API永久降价最高99% / 不再区分上下文窗口长度 / 同等价格下Token用量提升5-8倍 / 与DeepSeek V4 Pro同价位 / 小米Q1研发投入90亿元同比增33.4%
Frontier · GitHub & arXiv 周边
10.2K Stars / 754个结构化网络安全技能 / 映射到5大安全框架 / 兼容Claude Code / Copilot / Codex CLI / Cursor / Gemini CLI等20+平台 / Python / 今日+880 Stars
3.3K Stars(+399 today) / 开源语音AI平台 / 自托管替代Vapi / Retell / 支持Speech-to-Speech和LLM / STT / TTS组合 / 可视化工作流构建器 / MCP原生 + 电话系统集成
arXiv 2605.17734 / 从Agent历史交互中自动提取可复用技能程序(Skill Programs) / 技能以程序化形式存储,可跨任务调用 / 解决长链条任务中Agent重复犯同样错误的问题 / 新加坡南洋理工大学