成为 AI 时代的产品经理 04|判断「该不该做」,第一次比「能不能做」更贵
先看一个最该信、却被判反了的判断。
METR 在 2025 年 2 月到 6 月做了一个随机对照实验,方法跟药物临床试验一个级别。16 个资深开发者,平均五年经验、在自己维护的项目上提交过上千次代码,用当时最强的 AI 工具干 246 个真实任务。事前他们以为 AI 能让自己快 24%;干完了,还觉得快了 20%。实际一测:慢了 19%。
注意这里被判错的是什么——不是什么复杂的战略,是「AI 到底有没有让我自己变快」,最简单的一个判断,发生在他们最熟的代码、最熟的项目上。最懂行的人,凭感觉,判反了。
这件事跟 AI 快不快关系不大。它真正戳中的地方是:当「做出来」变得又快又便宜,你最不能信的就是「感觉」。而产品经理每天都在凭感觉做一个更贵的判断——这个东西,该不该做。
一、别再拿「这个难不难做」当门槛
过去你筛想法,有一道天然的门槛替你把关:工程师说「这个要三个迭代」,你掂量一下投入产出,多半就把它放下了。实现难度帮你毙掉了大量「想做但不值得做」的东西——你以为是自己在判断,其实有一半是难度在替你判断。
现在 AI 说「这个下午就能给你」。门槛没了。结果不是你做成了更多对的事,是你一口气上线了五个功能,其中四个没人用。Marty Cagan 2026 年说得直接:AI 没解决「该做什么」的问题,只是让公司更快地做出一堆没人要的东西——同样烂的路线图,只是跑得更快了。
所以第一个动作是反直觉的:把「能不能做、多久能做」从你的决策依据里划掉。它现在的答案永远是「能、很快」,对你筛选想法不再提供任何信息。
二、动手前,先问「不做会怎样」
实现免费之后,最容易漏掉的一问是反过来的:这个东西不做会怎样?
假设我们这个迭代不做这个「智能推荐」,会发生什么? 谁会因此真的受影响、影响到什么程度?有没有人会因为没有它而走?
如果你诚实回答完,发现「不做也没什么事」,那这就是答案——它不该排在这个迭代。这一问之所以有用,是因为它绕开了「做起来很爽、AI 一下午就能出」的诱惑,直接逼你面对价值。一个功能能不能被「不做会出事」撑住,比它做起来多快重要得多。
三、动手前,写下「做完之后,什么会变成真的」
Cagan 说产品经理真正拥有的是两样:why(为什么这个问题值得解)和 what(做完之后,我们期望什么变成真的)。第二样要在写代码之前就落成一句能被证伪的话。
上线这个新手引导后,我们期望:新用户第一周的留存从 35% 提到 45% 以上;如果两周后没动,就是我们判断错了,砍掉。
写不出这句话,说明你其实不知道自己为什么要做它。能写出来,你就有了一把尺子:用你自己事先立的、可以被打脸的预期来量,别拿「老板喜不喜欢」「同行有没有」当尺子。这把尺子 AI 给不了你,它不知道你的生意里什么算成。
四、让 AI 摆选项,判断留给你——但别信「感觉对」
AI 最适合干的,是把可能性铺开:同一个问题给你三五种解法、各自的代价、别人怎么做的。Cagan 的说法是 AI surface 选项,人来判断哪个值得。这一步你尽管用它。
但选的时候,回到开头那个实验:别信「感觉对」。那 16 个专家凭感觉判断「变快了」,集体判反。你凭感觉判断「这个方案更好」,一样不可靠。拿它去对第三步那把尺子——哪个选项最可能让你写下的那句预期变成真的,以及有没有真实证据(用户说过、数据见过),而不是哪个读起来最顺。
今天能做的一件事:挑一个你正打算做、而且「AI 很快就能做出来」的功能,先别写任何东西,把两句话写下来——不做会怎样、做完之后什么会变成真的。哪句写不出来,就是你今天用最低成本捡到的一个判断。
延伸阅读
- METR《Measuring the Impact of Early-2025 AI on Experienced Open-Source Developer Productivity》(慢 19%、自以为快 20% 的原始报告):https://metr.org/blog/2025-07-10-early-2025-ai-experienced-os-dev-study/
- Marty Cagan / SVPG 关于 AI 时代产品经理拥有 why 与 what:https://www.svpg.com/
- 本系列第 03 篇《把 AI 当同事,而不是工具》:/zh/blog/ai-as-colleague/
- 本系列第 01 篇《产品经理哪些活被 AI 接走了,哪些活反而更值钱》:/zh/blog/ai-pm-what-changed/
讨论