AIコーディングが高すぎるのではない――誰も価値を測っていないだけだ
ここ2週間、企業AI界隈で最も目を引いたニュースが2本あった。MicrosoftがExperiences + Devices部門でClaude Codeを廃止し、数千人のエンジニアをGitHub Copilotに戻す決定を下したこと。そしてUberが2026年のAIコーディングツール予算をわずか4ヶ月で使い切ったこと。
世論の解釈はほぼ一色だ。AIコーディングは高すぎる、バブルが弾ける。 ヘビーユーザーの月額500〜2000ドルというtokenの請求書は、確かに目が飛び出る額だ。
だが私はこの解釈がズレていると思う。本当に清算されたのは「AIが高すぎる」ではなく、もっと居心地の悪い事実だ――その金が何に化けたか、ほぼ誰も測っていなかった。
一つの細部がすべてを暴く
Uberの施策に、最も雄弁な証拠が潜んでいる。彼らは社内でAIツールの利用量でチームをランキングするリーダーボードを運用していた。3月までに、5000人のエンジニアのうち84%が「agentic codingユーザー」に分類された。
このリーダーボードが何を報酬として与えていたか、立ち止まって考えてほしい――それはtokenを燃やすことであり、価値を生み出すことではない。「たくさん使う」を競える名誉として掲げれば、当然みんな競って使う。予算が燃え尽きたのは事故ではなく、このインセンティブ設計の必然的な帰結だ。
そして請求書が届いたとき、財務部門が見たのはドル単位で精確なコストの数字と、まったく説明のつかないリターンだった。UberのCOO自身が率直に認めている。使った金と生み出した機能の間の「その線はまだつながっていない……今、有用な機能を25%多く出しているとは言いにくい」と。
これはAIの失敗ではない。度量衡の失敗だ。
「なんか速くなった気がする」で予算争いには勝てない
最も皮肉なのはここだ。これらの企業は、自分たちのAI製品に対しては評価フレームワークを必死に構築し、ゴールドスタンダードのデータセットを求め、品質のあらゆる側面を数値化しようとしている。なのに自分たちが使うAIツールについては、「生産性向上」が一度も検証されることなくデフォルトで成立している前提として扱われている。
「速くなる」は証明不要の自明な事実として通っていた。agentの稼働時間を実際の成果物・実際に価値ある出力と結びつけた人間がいなかった。その結果、CFOが請求書を手に「この500万ドルで何を手に入れたのか」と問うたとき、エンジニアチームは「なんか速くなった気がする」と答えるしかなかった――そして「気がする」は予算会議ではゼロに等しい。
この清算は何を清算したのか
清算されたのはAIコーディングではない。AIをレバレッジではなくパフォーマンスとして採用する姿勢だ。
ツールを展開して、利用量ランキングを立ち上げて、84%の普及率を達成する――これらはすべて「採用」の見た目であり、「戦略」ではない。本当の戦略とは、最初から「これは何をてこにするのか」を明確にし、その「何か」を測定可能にして価値に結びつけることだ。
私の見立てはこうだ。これから生き残るチームは、AIツールを最も大きく削減した組織でも最も倹約した組織でもない。tokenの支出を実際に届けた価値に結びつけ、その線をCFOの前に持ち込んで堂々と主張できる唯一のチームだ。 このコスト逆流は、「AIをレバレッジとして使うチーム」と「AIをショーとして使うチーム」を、きれいさっぱり分別するだろう。
もう一つ、耳に痛いことを言う。もしあなたがこの一年間ずっと「利用量」を指標にしてきたなら、すでにこの議論で負けている――なぜなら、価値ではなくそのダッシュボードを最適化するよう、組織全体をあなた自身がトレーニングしてきたのだから。
ディスカッション