2026-06-09

AI 编程不是太贵,是没人量过它到底值多少

这两周企业 AI 圈最扎眼的两条新闻:微软要在 Experiences + Devices 部门内部砍掉 Claude Code、把上千工程师推回 GitHub Copilot;Uber 则是四个月就烧光了 2026 全年的 AI 编程工具预算。

舆论的解读几乎一边倒:AI 编程太贵了,泡沫要破了。 重度用户每月 500 到 2000 美元的 token 账单,确实吓人。

但我觉得这个解读偏了。真正被清算的不是「AI 太贵」,是另一件更尴尬的事:几乎没有人,量过这笔钱到底换回了多少东西。

一个细节暴露了全部

Uber 的做法里藏着最说明问题的一笔:他们在内部上线了一个按 AI 工具用量给团队排名的排行榜。到三月,5000 名工程师里 84% 被划成了「agentic coding 用户」。

停下来想想这个排行榜在奖励什么——它奖励的是烧 token,不是产出价值。你把「用得多」做成了一个可以攀比的光荣榜,那大家当然会拼命用。预算被烧光,不是意外,是这套激励的必然结果。

于是账单来的时候,财务能看到的是一个精确到美元的成本数字,和一个完全说不清的收益。Uber 的 COO 自己承认得很坦白:花的钱和产出的功能之间,「那条线还连不起来……很难说我们现在就多产出了 25% 有用的功能」。

这不是 AI 的失败,是度量的失败

你没法用「感觉更快了」去打赢一场预算战

最反讽的地方在这里:这些公司,正是一边在给自己的 AI 产品疯狂建评估体系、要金标准数据集、要把每一点质量都量化的同一批人;可轮到自己用的 AI 工具,「提效」却是一个默认成立、从没被验证的假设。

「更快」被当成了不证自明的事。没人去把 agent 工时和真正交付、真正有价值的产出连起来。结果就是:当 CFO 拿着账单问「这 500 万买到了什么」,工程团队只能答「感觉快了不少」——而「感觉」在预算会议上,约等于零。

所以这场清算到底清算了什么

它清算的不是 AI 编程,是把 AI 当表演、而不是当杠杆的那种采用方式。

铺开工具、上个用量排行榜、84% 渗透率——这些都是「采用」的样子,不是「策略」。真正的策略是:从一开始就想清楚,这玩意儿到底要撬动什么,并且能把那个「什么」量出来、连到价值上。

我的判断是:接下来活下来的团队,不会是把 AI 工具砍得最狠、用得最省的,而是唯一一批能把 token 花销连到已交付价值、并且敢拿这条线去跟 CFO 据理力争的。这场成本回潮,会把「拿 AI 当杠杆」的团队和「拿 AI 当作秀」的团队,干净利落地分开。

还有句不太好听的:如果你这一年衡量的一直是「用量」,那你其实已经输掉了这场争论——因为你亲手训练了整个组织去优化那块仪表盘,而不是去优化价值。

延伸阅读

讨论

无需登录,匿名即可发言,请友善。
加载中…