2026-06-09

AI 编程不是太贵，是没人量过它到底值多少

这两周企业 AI 圈最扎眼的两条新闻：微软要在 Experiences + Devices 部门内部砍掉 Claude Code、把上千工程师推回 GitHub Copilot；Uber 则是四个月就烧光了 2026 全年的 AI 编程工具预算。

舆论的解读几乎一边倒：AI 编程太贵了，泡沫要破了。 重度用户每月 500 到 2000 美元的 token 账单，确实吓人。

但我觉得这个解读偏了。真正被清算的不是「AI 太贵」，是另一件更尴尬的事：几乎没有人，量过这笔钱到底换回了多少东西。

一个细节暴露了全部

Uber 的做法里藏着最说明问题的一笔：他们在内部上线了一个按 AI 工具用量给团队排名的排行榜。到三月，5000 名工程师里 84% 被划成了「agentic coding 用户」。

停下来想想这个排行榜在奖励什么——它奖励的是烧 token，不是产出价值。你把「用得多」做成了一个可以攀比的光荣榜，那大家当然会拼命用。预算被烧光，不是意外，是这套激励的必然结果。

于是账单来的时候，财务能看到的是一个精确到美元的成本数字，和一个完全说不清的收益。Uber 的 COO 自己承认得很坦白：花的钱和产出的功能之间，「那条线还连不起来……很难说我们现在就多产出了 25% 有用的功能」。

这不是 AI 的失败，是度量的失败。

最反讽的地方在这里：这些公司，正是一边在给自己的 AI 产品疯狂建评估体系、要金标准数据集、要把每一点质量都量化的同一批人；可轮到自己用的 AI 工具，「提效」却是一个默认成立、从没被验证的假设。

「更快」被当成了不证自明的事。没人去把 agent 工时和真正交付、真正有价值的产出连起来。结果就是：当 CFO 拿着账单问「这 500 万买到了什么」，工程团队只能答「感觉快了不少」——而「感觉」在预算会议上，约等于零。

它清算的不是 AI 编程，是把 AI 当表演、而不是当杠杆的那种采用方式。

铺开工具、上个用量排行榜、84% 渗透率——这些都是「采用」的样子，不是「策略」。真正的策略是：从一开始就想清楚，这玩意儿到底要撬动什么，并且能把那个「什么」量出来、连到价值上。

我的判断是：接下来活下来的团队，不会是把 AI 工具砍得最狠、用得最省的，而是唯一一批能把 token 花销连到已交付价值、并且敢拿这条线去跟 CFO 据理力争的。这场成本回潮，会把「拿 AI 当杠杆」的团队和「拿 AI 当作秀」的团队，干净利落地分开。

还有句不太好听的：如果你这一年衡量的一直是「用量」，那你其实已经输掉了这场争论——因为你亲手训练了整个组织去优化那块仪表盘，而不是去优化价值。