LIVE · 每日 AI 晨报

把过去 24 小时
真正值得知道的 AI 动态,
讲清楚。

宁缺毋滥。剔除公关稿、雷同炒作和无技术内核的"行业畅想"——只看创新性、落地价值、可借鉴的工程或商业洞察。

📅 日期 2026-05-25(周一) 🌍 覆盖 硅谷 · 开源 · 大厂 · 学术 🧠 整理 Mavis

通用信息

底层大模型 · 基建突破 · 资本与合规

5 条
01

Anthropic 估值有望突破 9000 亿美元,逼近 OpenAI 王座

核心事件
据央视财经及华尔街日报,Anthropic 新一轮融资估值有望突破 9000 亿美元,超越 OpenAI 成为全球估值最高 AI 初创;预计 Q2 营收 109 亿美元,环比翻倍,有望出现首个盈利季度,最快今年 10 月 IPO。同期统计显示,Anthropic + OpenAI 已合计吃下 34 家头部 AI 公司 89% 的收入份额(800 亿美元年化中的 712 亿)。
价值与借鉴
别再迷信"AI 应用层会百花齐放"——红杉的判断正在被数据反复印证:模型层赢家通吃,应用层企业既要付昂贵的 token 费(Cursor 上季度毛利率曾跌至 -23%),还要随时面对模型厂商下沉做自家垂直产品的反向竞争。对企业落地的启示:① 关键应用必须做"双模型可切换"架构,避免被单一厂商涨价吓崩毛利;② 选 SaaS 时,要追问其供应商集中度和 token 成本占收入比,这是判断长期议价能力的核心指标。
信息出处
央视财经、华尔街日报、The Information《AI Startups Revenue Analysis》
02

DeepSeek-V4-Pro API 永久降价至原价 1/4

核心事件
DeepSeek 官宣:V4-Pro 模型 API 在 5 月 31 日 2.5 折优惠结束后,正式以原定价的 1/4 永久执行,相当于把折扣价格直接固化为新基准。
价值与借鉴
这是国产模型用"工业级 API 生态"对硅谷打的价格战正面一击——OpenRouter 数据显示上周(5/18-5/24)中国大模型周调用量 9.22 万亿 Token(环比 +19.89%),已连续四周超过美国。对企业的直接借鉴:曾经被高 token 成本压制的"高频 Agent 场景"(长上下文摘要、批量数据分析、Agent 多轮规划)现在 ROI 模型可以重算,原本测算不划算的项目要拿出来重新做一遍 cost model。
信息出处
DeepSeek 官方公告、OpenRouter Weekly Stats
03

英伟达 Vera Rubin 进入量产前最后冲刺,推理吞吐 35×

核心事件
5 月 23 日,黄仁勋提前 4 天抵台亲自督阵 Vera Rubin(Rubin GPU + Vera CPU)的产品导入,采用台积电 3nm + CoWoS-L 封装,首次支持 8 层 HBM4,推理吞吐量较 Blackwell 高 35 倍,计划 Q3/Q4 量产。同期台积电 3nm AI 芯片良率突破 90%,AMD MI400X 算力翻倍、能效提升 80%。
价值与借鉴
"推理"这个字眼正成为整个硬件叙事的新轴心——这与 OpenAI、DeepMind 把成本砍到 -40% 的软件侧推理优化是同步发生的。给做 AI 基建采购决策的人一个信号:下半年是采购窗口期,Q3 之后高端 GPU 现货供给会有显著缓解,砍价空间打开;同时数据中心散热(液冷)、新型电网投资("十五五"超 5 万亿)是配套确定性投资方向。
信息出处
路透社、观点网、长城证券研报
04

国家发改委明确"AI+"配套文件落地,央国企将开放高价值场景

核心事件
5 月 22 日发改委月度发布会明确:近期将出台加快"人工智能+"落地的配套文件,持续推动央国企开放高价值应用场景,引导 AI 融入生产、经营、管理各环节。配套政策与 5 月 8 日三部委联合印发的智能体专项政策《智能体规范应用与创新发展实施意见》形成组合拳。
价值与借鉴
"央国企开放场景"这八个字含金量极高——过去 AI 公司最缺的不是技术,是高质量的真实业务数据和复杂场景。对乙方企业:现在是把成熟方案打包成"标杆案例" pitch 进国央企的最佳窗口期。对甲方企业:政策已经把合规风险大幅降低,过去因数据合规犹豫的项目可以重启评估。
信息出处
国家发改委发布会、网信办/发改委/工信部联合文件
05

Google Gemini Omni 发布:原生全模态世界模型

核心事件
5 月 20 日 Google I/O 发布 Gemini Omni,支持图像 / 音频 / 视频 / 文本的原生(非拼接)多模态输入输出,集成 Gemini 推理 + Nano Banana 创作 + Veo 视频能力,对话式视频编辑成型;联合负责人 Dumitru Erhan 透露评估时需要同时跑视频生成、视频编辑、图像生成、文本对齐、音频同步五条评估管线。
价值与借鉴
"原生融合"正在成为下一代基础模型的标配(GPT-5 走的也是这条路),意味着跨模态推理错误率可降低 30%+。给创业者的直接信号:靠"模态拼接"做轻量产品的窗口正在关闭,要么深耕场景做 workflow,要么找 niche 模态(触觉、3D 点云、生物信号)做深;不要再做"GPT 套壳 + Whisper + DALL-E"这种缝合怪。
信息出处
Google I/O 2026 Keynote、国投证券计算机周报
🤖

Agent 应用

落地实践 · 多 Agent 协同 · 新交互模式

4 条
01

Codex 用 /goal 解决 Agent 长任务稳定性

核心事件
OpenAI Codex 团队 5 月 23 日技术博客披露:让 Agent 稳定执行长任务的核心机制不是更强的 LLM,而是一张结构化状态表(state table)——/goal 命令把任务拆解为可验证的中间状态,每一步执行前后强制对齐表中字段,Agent 出错后可从最近一致状态点恢复,而非整段重试。
价值与借鉴
这是对所有做生产级 Agent 团队的关键启示——Agent 不稳定的真正瓶颈是"上下文漂移"和"状态遗忘",不是模型能力不够。它印证了上周那篇 PROOFGRID 论文揭示的"认知不稳定指数"问题:顶级模型的全局推理一致性也仅 0.27-0.62。落地建议:构建任意长任务 Agent 时,先设计状态机和验收字段,再选模型;这比换更贵的模型有效得多。
信息出处
OpenAI Codex Engineering Blog、技术文库聚合
02

Cloudflare 大规模 AI Code Review 编排架构公开

核心事件
Cloudflare 工程博客披露其 AI Code Review 在全公司规模化编排的实践:通过多 Agent 流水线(PR 分类 → 静态分析 → 安全审查 → 性能审查 → 风格审查 → 汇总),每个子 Agent 用不同模型 + 不同提示模板,主控 Agent 负责冲突仲裁和最终输出。
价值与借鉴
"用一个全能 Agent 干所有事" vs "多个专家 Agent 协同"的工程路线之争已经分出胜负——生产环境一定走多 Agent。这套架构最有价值的细节是"主控 Agent 仲裁冲突",解决了多 Agent 系统最痛的"输出打架谁说了算"问题。对内部要落地 AI Code Review 的团队:直接对标 Cloudflare 的分工粒度,不要重新造轮子。
信息出处
Cloudflare Engineering Blog "Orchestrating AI Code Review at scale"
03

Dropbox 内部编码 Agent 平台 Nova 发布

核心事件
Dropbox 工程团队 5 月 22 日公开内部编码 Agent 平台 Nova 的设计:将 Coding Agent 作为公司基础设施提供,而非每个团队各自集成 Cursor / Claude Code;统一身份认证、权限管理、审计日志、模型路由,所有 Agent 调用流量经过中央管控。
价值与借鉴
这是大厂"Agent 治理"的范式样本——当 AI Coding 成为日常工具,数据外流、密钥泄漏、合规审计就从开发者个人选择问题变成 CISO 必管议题。对所有 500 人以上的工程组织:Cursor / Claude Code 各团队自由用的红利期即将结束,需要立项"内部 AI 开发者平台",否则下一次安全审计会被审到崩溃。
信息出处
Dropbox Tech Blog "Introducing Nova"
04

京东 × 擎天租:仓储 + 履约场景 Agent 化战略合作

核心事件
5 月 21 日,京东与国内头部机器人应用平台擎天租达成战略合作,依托京东供应链场景,联合推动具身机器人在仓储自动化、智能调度、无人履约、数字化维保四个关键领域的落地;同时共建机器人售后体系(检测、维修、保养、翻新、回收)。
价值与借鉴
这是少数有"完整闭环"的具身 Agent 商业案例——不是 demo,是把机器人的整个生命周期(部署→运维→翻新→回收)都纳入了商业模式。对人形 / 具身机器人创业者:硬件能力差距正在缩小,真正的护城河是后市场服务网络。这也回答了一个困扰行业的问题:高盛 2035 年 1540 亿美元市场预测的钱怎么落地——答案是租赁 + 服务订阅,不是一次性硬件销售。
信息出处
财联社、中航证券人形机器人产业研报
📊

Data Agent 相关

AI + BI · Text-to-SQL · RAG 深度融合

4 条
01

思迈特 SmartBI 白泽 V5:企业级 Agent BI 走出"概念展示"阶段

核心事件
思迈特软件正式发布 SmartBI 白泽 V5,定位企业级 Agent BI,采用"统一指标模型 + 多智能体平台"双轮驱动架构,包含四层复合计算引擎、智能推理机制、分层进化能力;支持自然语言问数、异常归因、多源数据融合、仪表盘 / 报告自动生成,兼容中国式复杂报表场景。已在能源、保险等行业落地数百个项目(如电费催收、阶梯电价预警、保险财务分析体系)。
价值与借鉴
国内 Agent BI 长期被"演示效果惊艳、落地一塌糊涂"的窘境困扰,根本痛点不是大模型不够强,而是企业的指标口径混乱、报表逻辑复杂——白泽 V5 把"统一指标层"做成第一公民是正确解法。给企业 BI 选型的实操建议:评估 Agent BI 产品时,把"指标口径一致性"和"复杂报表(多表头 / 合并单元格 / 嵌套小计)兼容度"作为前两个硬指标,比"自然语言准确率"重要 10 倍。
信息出处
思迈特发布会、企鹅号《白泽 V5 发布》
02

迅策科技 Token 调用 ARR 季度环比 +300%,垂类数据中枢模式被资本验证

核心事件
港股迅策科技披露:4 月 Token 调用 ARR 季度环比暴涨 300%,其垂类场景 Token 定价达 10-100 美元 / 百万 Token,超 Anthropic 十倍以上。德银将目标价从 85 港元大幅上调至 351 港元,国泰海通维持"增持"。核心逻辑:企业级 AI 数据治理需求爆发,Token 化付费正成为新计价范式。
价值与借鉴
这是 Data Agent 商业模式的关键样本——通用大模型的 token 在打价格战(DeepSeek 砍到 1/4),但垂类数据 / 治理 token 反而能卖出 10-100x 溢价。逻辑:通用 token 是商品,垂类 token 是带场景的 know-how。对所有想做 Data Agent 创业的团队:不要去做"通用 Text-to-SQL",要做"金融监管报表 Token""医保结算单 Token""ERP 凭证 Token"这种带行业护城河的窄场景,定价权完全不一样。
信息出处
德银研究报告、国泰海通证券、招商证券 AI 模型商业化飞轮报告
03

飞书绩效"宽表 SQL 自动生成"工程实践公开

核心事件
字节飞书工程团队公开《「飞书绩效」宽表 SQL 自动生成逻辑浅析》:针对绩效场景下需要从数十张维度表 + 事实表自动拼接宽表的痛点,设计了基于元数据驱动 + LLM 二次校验的 SQL 生成器,避免传统 Text-to-SQL 在企业级宽表场景的 join 错乱和性能爆炸。
价值与借鉴
这是少数把"Text-to-SQL 真正用到生产"的细节披露——大部分公开的 Text-to-SQL 方案只能处理 3-5 张表的简单 join,真实企业的宽表通常涉及 20+ 表。飞书的关键设计是"先用元数据图把所有可能的 join 路径预计算,LLM 只负责挑路径不负责拼 SQL",这极大降低了幻觉风险。给所有踩过 Text-to-SQL 大坑的团队:不要让 LLM 直接写 join,让它在预定义的 join 模板里选
信息出处
飞书技术博客(技术文库 2026-05-23 收录)
04

开源 DataAgent:Text-to-SQL + Python 分析 + 自动报告一站式(Spring AI Alibaba Graph)

核心事件
开源项目 DataAgent 持续迭代,基于 Spring AI Alibaba Graph 构建企业级智能数据分析 Agent,超越传统 Text-to-SQL,集成 Python 深度分析 + 多维度图表报告生成;全面兼容 OpenAI API 规范,支持私有化部署(适配 Qwen、DeepSeek 等国产模型),可灵活挂载任意向量数据库。
价值与借鉴
这是国内 Java / Spring 生态首个完整闭环的 Data Agent 开源项目——意义在于让传统企业(金融、政企、制造业,绝大多数是 Java 技术栈)能在不引入 Python 重栈的前提下落地 Data Agent。给中小企业的实操建议:如果你的技术栈以 Spring 为主,先用 DataAgent 跑通 PoC,再决定要不要花预算买商业版本(如思迈特白泽 V5);它的"Text-to-SQL → Python 分析 → 报告"三段式架构本身就是优秀的参考实现。
信息出处
GitHub 开源仓库、CSDN 技术分享
今日小结 · 一句话洞察

Token 经济正在分层——通用 Token 砍到地板价(DeepSeek 1/4),垂类 Token 卖出 10-100× 溢价(迅策科技)。2026 下半年 AI 的核心动作,不是"做更通用的 Agent",而是用 Agent 把每个细分行业的隐性 know-how,转化为可计量的 Token 单价

链接已复制,去群里分享吧 ✨