算数を、短く
本シリーズ第1回では、3月と4月に定額制AIサブスクで何が起きたかを並べた。GitHub Copilotは6月1日からクレジット制に移行する。Anthropicは6週間にわたってClaudeの上限を調整し、サードパーティ・ハーネスを遮断し、Claude Codeを一時的にProから外し、Maxユーザーが2日で週上限を使い切ったあとにポストモーテムを公表した。値上げメールが受信箱に届き始めた。
今回のテーマは「なぜそれが驚きではないのか」だ。
4月の出来事を、個別の運用判断の連続として読みたくなる。ここでスロットル、あそこで上限、料金ページで不器用なA/Bテスト。それらは見える部分だ。どの月単位の動きにも見えないが、すべてを動かしているのは、フロンティアAI推論にかかる実コストと、定額契約者が支払う金額の差だ。その差は小さくない。今日の消費者向けプロダクト市場の中でも、最大級に開いている差だ。
数字をいくつか並べてみると、驚きは「定額がきしんでいること」ではなくなる。むしろ「ここまで持ったこと」のほうになる。
スプレッドシートが合わない
最も引用される一行から始めたい。Wikipediaの「AI bubble」の項目(そう、項目があるのだ)によれば、OpenAIのMicrosoft Azureでの推論コストは、2024年通年で約37.6億ドルだった。2025年上半期だけで50.2億ドルだ。推論コストである。トレーニングでも、設備投資でも、人件費でもない。ChatGPTで有料ユーザーが入力したプロンプトに答えるコストだけで、その金額だ。
それを直線で延ばすと、OpenAIの2025年通年の推論コストは100億ドル超になる。同じソースは、OpenAIの旗艦動画モデルSoraが2026年3月下旬、リリースから半年で打ち切られたことも記している。理由は誰も使わなかったからではない。ユニットエコノミクスが成立しなかったからだ。動画一本あたりのコストが、ユーザーの支払い意思額と一致しなかった。だからOpenAIは補助を止めた。
視野を広げよう。Derek Thompson氏のAIバブル崩壊論(Paul Kedrosky氏へのインタビューを含む)によれば、米国のAI設備投資は2026〜2027年合計で5,000億ドルを超える見通しだ。データセンター、チップ、電力、ファイバー、冷却。いずれ回収を求められる資本だ。一方、米国の消費者がAIプロダクトに支払っている金額は年間で約120億ドル前後と見られる。二つの数字は同じ部屋にいない。同じ大陸にすらいない。
片側に5,000億ドルの設備投資、もう片側に120億ドルの恒常的な消費者支出。これが「差」の中身だ。算数は誰でもできる。基本的に二つしか合致経路はない。消費者支出が2年で40倍ぐらいになるか(消費者市場でそれは起きない)、もしくは資本側がいずれ「スプレッドシートが閉じる単価」を要求するか、だ。定額サブスクの値付け直しは、後者がスローモーションで進んでいる姿だ。
ここで、私が以前書いた歴史的先例、2025年1月のDeepSeekが改めて効いてくる。DeepSeek R1は西側フロンティアと比べてトレーニングコストを95%程度下げた。市場は即座に反応した。NVIDIAは1日で17%下げた。あの日の教訓は「競争力のあるモデルを作るには数百億ドルかかる」という確信に反例ができたこと、そして反例が一つでも出てしまえば、設備投資ナラティブ全体に疑問符がつくということだった。その疑問符は消えていない。むしろ大きくなっている。
コストカーブは逆方向に動いている
外から見るとわかりにくいが、開発者として中から見ると当たり前の話がもう一つある。今みんながAIに求めている能力、マーケティング資料が約束している能力は、クエリ単位で見ると最も提供コストが高いものだ。
人間のフィードバックを使った強化学習はすでに学習コストを引き上げていた。次に推論モデル、つまり答える前に「考える」モデルが来た。今やエージェンティック・ループ、モデルが数十から数百ステップを踏み、ツールを呼び、ファイルを読み、自分の出力を読み返すワークフロー。さらに「extended thinking」、その名のとおりの機能。どれもモデルを良くする。どれも、リクエスト1件あたりに生成されるトークン数が前世代より増える。場合によっては桁単位で増える。
第1回でも触れたが、AnthropicのOpus 4.7はOpus 4.6に比べてClaude Codeのセッションがおよそ3倍長く動く。これはバグではない。プロダクトが意図どおりに働いている結果だ。モデルがより長く考えることを許され、実際に長く考え、結果として良い答えを出す、だから生成コストが上がる。定額のユーザーは同じ料金を払い続ける。むしろ答えが良くなった分だけ満足度が上がる。ユーザーから見ると、これはプラットフォームの改善だ。提供者から見ると、毎月のクラウド請求書は前月より大きくなり、サブスク売上の項目だけが据え置きになる。
ここで能力天井の議論に少し触れておきたい。Yann LeCun氏は現行LLMのスケーリングが本質的限界に近づいていると主張してきた。彼に同意するかどうかは別として、この主張のAIエコノミクスへの帰結が、この記事との接点だ。今後の限界的な能力向上が不釣り合いに大きな計算量を要求するなら、スプレッドシートはむしろ悪化する。「効率化でマージンを直す」という言い分はCFOへの説得が難しくなる。蒸留、特化型小型モデル、Mixture of Experts。効率化の勝ち筋自体は本物だ。だが、それぞれ単独で5,000億ドルの差を埋めるほどの大きさはない。
つまりコストカーブは逆方向に動いていて、同時に需要カーブはプロバイダーが望んだとおりに伸びている。両方が真実だ。両方とも、同時に。
公正な反論を無視しない
バブル論への反論をしている人々にも公正でありたい。彼らの議論は決してばかげていない。私が見た中で最も明快なのは、OmdiaのVlad Galabov氏のものだ。
彼の主張はBroadband Breakfastの記事に整理されている。バブル論は株式市場の挙動と実需を混同している、と。トークン消費は2025年10月の毎分約600万トークンから、2026年3月には毎分約150億トークンになった。GPU価格は下落していない。むしろ48%上昇している。「買い手不足」というバブル的予測とは逆の方向だ。
Galabov氏の読みは「需要は本物で、ボトルネックは食欲ではなく供給だ」。前半について、私は彼が正しいと思う。
私が付け加えたいのは、実需が本物であることは、バブル論を否定しないという点だ。むしろ本シリーズで一番大事な部分を強化する。元の議論は「誰もAIを使いたがっていない」ではない。「定額の消費者向け価格は、本物の需要を実コストで提供できる水準に設定されていない」だ。需要は本物、供給は逼迫、GPU価格は上昇。だとすれば、その需要を固定月額で抱えるプロバイダーの立場は、改善ではなく悪化している。Galabov氏のデータは定額制を救わない。それが値付け直されている理由を説明している。
もう一つ抑えておきたいのは、消費者側の数字だ。以前「ChatGPTのようなAIツールを実際に毎日使っている人は意外と少ない」と書いたとおり、「少数のヘビーユーザーによる本物の需要」と「広い消費者層への普及」の差はまだ大きい。毎分150億トークンは現実だが、消費は集中している。Claude Codeのヘビーユーザー、エージェンティックなコーディング・ワークフロー、大企業の大規模パイロット。「全員が月20ドルを払い続ける」波で5,000億ドルの設備投資の差を埋める、という線は、今のグラフには見えていない。
静かに値付け直されるロスリーダー
ピースを並べよう。
設備投資は消費者収益に対し1桁以上の差で大きい。クエリ単価のカーブはユーザーが望む機能ほど高い側に動いている。実需は存在するが、定額制の前提を壊すヘビーユーザーに集中している。DeepSeekの先例は、需要が本物でも資本集約戦略は安全ではないことを示している。そして定額制AIサブスクというカテゴリ自体、最初から透明にユーザー獲得用のロスリーダーだった。
3月と4月の出来事は、その算数の表面だ。個別の運用判断の連続ではない。値付け直しが必要だったプロダクト群を、分割で値付け直している、その途中の風景だ。
私はこれを悲しい話とは思わない。驚くような話とも思わない。テクノロジー・サイクルのどこかの段階で必ず起きる、価格表が実際のワークロードに追いつき、暫定価格表で組んでいた人々が永続価格表に向けてスタックを再設計しなければならない局面、それだけだ。月20ドルや200ドルでフロンティアAIを売った会社は、2年間にわたって安すぎる値段で売ってくれた、という意味で全員に貢献した。エージェンティック・ワークフローが書ける開発者世代を一気に育てた。今は、その世代がワークフローの実コストに近い金額を払う番だ。
面白い問いは、これがバブルかどうかではない。私が書く対象である中小企業が、これに対して実際に何をすべきか、だ。第3回はそこに使いたい。答えは、この記事のトーンが示唆するよりも明るい。すべての値上げと並行して、本当に良いことが起きているからだ。フロンティアの下に、本物のオープンウェイト層が2025年から2026年初頭にかけて成熟した。今やルーティングの判断、サブスクの判断ではなくルーティングの判断こそが効くフェーズに入っている。
それは次回。
それまでに私が言いたいのは、こうだ。AIツールの上で事業を組んでいる中小企業は、4月の出来事にパニックする必要はない。あれは何かの終わりではない。請求書に従量課金が現れ始める初日であり、その変化の背後にある算数は、どの見出しよりも古く、静かだ。変更を発表している会社は、誰が電卓で叩いても出る数字に応じている。それに合わせて計画すればよい。床は抜けない。床は値付け直されている。
私はまだ地上にいる。下から見える景色のほうが軌道から見るより面白い。3週間前に書いた宇宙のバブル論は、衛星申請より値上げメールのほうがよく当てはまる、という形で残っている。それでいい。仕事は思っていたより机の上に近かった、というだけのことだ。
関連記事
値上げメールが届き始めた ―AIバブル、ターミナルから縮む― (第1回/全3回)
3週間前、宇宙データセンターはバブルの匂いがすると書いた。バブルは予想より早く現れた。しかも軌道上ではなく、私のメール受信箱に。GitHub Copilotは6月1日から従量制へ移行する。Anthropicは3月以降、Claudeの利用上限を静かに絞り続けている。定額制AI時代は終わりつつある。
宇宙にデータセンターを建てるという話 ―これはAIバブルの匂いだ―
ブルーオリジンが衛星51,600機、SpaceXが100万機。AI需要の爆発で、データセンターの宇宙進出計画が相次いでいる。東京でAI会社を経営する私から見ると、これはバブルの古典的な兆候だ。中小企業が見るべきところは宇宙ではなく、足元にある。
AIの幻覚の原因と解決策を理解する
AIが時々物事を作り上げてしまうのはなぜだろうと思ったことはありませんか?AIの幻覚とは何か、なぜ起こるのか、そしてこれらのエラーを最小限に抑えるために私たちが使用している革新的な戦略について探ってみましょう。