メニュー

公開日 カテゴリー AI・中小企業

ソフトバンクのAI「セントラルキッチン」は正しい問題を間違った方法で解こうとしている

イクバル・アバドゥラ
著者 イクバル・アバドゥラ
合同会社LaLoka Labsの創業者・CEO
ソフトバンクのAI「セントラルキッチン」は正しい問題を間違った方法で解こうとしている
ソフトバンクが新聞社・出版社のコンテンツをAI企業向けに仲介するプラットフォームを構築中で、クリエイターへの収益還元も行うという。日本でAIコンテンツ会社を経営し、長年クリエイターへの対価支払いを主張してきた私としては、喝采を送るべきだろう。しかし、手放しでは喜べない。

私は日本でAIコンテンツ会社を経営している。ソフトバンクは私のデータ供給者になりたいらしい。

3月26日の『中日新聞』の報道 (有料記事) を読んで、最初に思ったのは「やっと誰かが配管を直そうとしている」ということだった。次に思ったのは「なぜソフトバンクなのか」ということだ。

何が起きているか。ソフトバンクがコンテンツの権利者(新聞社、出版社)とAI事業者の間に立つプラットフォームを構築している。記事を預かり、AIサービスが利用できるデータ形式に加工し、ライセンスを管理する。コンテンツが使われた分だけ、権利者に収益が還元される。AI事業者は出所が明確なデータを手に入れ、法的なグレーゾーンも、無断利用のリスクもない。

試用版は今夏に開始。正式版は2027年春の予定だ。まずはテキストから始まり、将来的には画像や映像にも拡大する構想がある。

私は東京を拠点にAIコンテンツ生成会社Kafkaiを経営している。今回の発表は、コンテンツを生み出す側と、AIで生成する側の間のサプライチェーンに、ソフトバンクが直接入ってくることを意味する。私は潜在的な顧客であり、潜在的なデータ提供元であり、このプラットフォームが再構築しようとしているエコシステムの参加者でもある。

だから、言いたいことがある。

問題は本物だ。私はずっとこのことを書いてきた。

まず明確にしておきたい。ソフトバンクが解決しようとしている問題は本物だ。私は1年以上前からこのテーマについて書いてきた。

問題その1:AI企業がクリエイターに対価を払わずに著作物をスクレイピングしている。 私はKadrey対MetaおよびBartz対Anthropicの著作権訴訟について詳しく書いた。Metaはライセンスコンテンツではなく、海賊版の書籍を意図的に選んでトレーニングデータに使った。日本の著作権法第30条の4は、著作物の利用が「享受を目的としない」場合にAIトレーニングへの利用を認めているが、法的に許されることと倫理的に正しいことは別の話だ。あのとき私が書いたように、機械は人間がすでに作ったものをコピーすることしかできない。人間への対価は後付けではなく、出発点であるべきだ。

問題その2:信頼性の低いトレーニングデータが信頼性の低いAIを生む。 『中日新聞』の記事はこの点について重要な指摘をしている。検証されていないSNSの投稿とプロのジャーナリズムを一緒にAIがトレーニングすれば、出力の品質は当然下がる。私はAIのハルシネーションについて書いた際、AIツールが15%から20%の確率で誤った情報を生成し、専門分野ではその数字が劇的に上がることを取り上げた。コンテンツの出所の追跡は、著作権の問題だけではない。品質の問題だ。

問題その3:日本のデータが閉じ込められている。 東京のVenture Cafe Global Gatheringのパネルに参加し、日本のAIの可能性について書いたとき、最も明確な発見の一つは、日本企業が膨大なデータセットを抱えているにもかかわらず、それが企業のサイロに閉じ込められ、スタートアップや研究者がアクセスできない状態にあるということだった。データは存在する。アクセスが存在しない。

ソフトバンクのプラットフォームはこの3つすべてに対応している。クリエイターに対価が支払われる。データの出所が追跡される。閉じ込められていたコンテンツがAI開発者に開放される。

喝采を送るべきだろう。一部はそうしている。だが、その構築方法は、解決しようとしている問題以上に私を不安にさせる。

セントラルキッチンの問題

『中日新聞』の記事は、ソフトバンクが意図した以上のことを露呈するアナロジーを使っている。このプラットフォームを「セントラルキッチン」に例えているのだ。食材を一括で加工し、チェーンレストランの各店舗に配送する、あの仕組みだ。

このアナロジーは正確だ。それが問題なのだ。

セントラルキッチンは、全店舗が同じハンバーグを出すファミリーレストランチェーンを運営するなら素晴らしい仕組みだ。食材を標準化し、加工を最適化し、均一なポーションを大量に配送する。均一性による効率化。

だが、AI開発はチェーンレストランのビジネスではない。

AI企業ごとにコンテンツに求めるものが根本的に異なる。医療AIを構築する企業は、カスタマーサービスのチャットボットを構築する企業とは異なる方法で記事を加工・注釈付けする必要がある。法律文書分析のモデルをトレーニングするスタートアップと、創作支援に取り組む企業では、要件が違う。セントラルキッチンは仲介者のスループットを最適化するものであり、食べる側の多様なニーズを最適化するものではない。

記事はまた、加工済みデータがAIコンテンツの「味付け」に使われると述べている。私はそれなりの数のキッチンで料理してきたから分かる。味付けを支配する者が、味を支配する。ソフトバンクはAI企業が自由に調理できる生の食材を提供しているのではない。加工済みの、味付け済みの料理を提供しているのだ。それはまったく別の話である。

キッチンを支配する者がメニューを支配する

ここからが構造的な懸念だ。

  1. 単一の仲介者がボトルネックを生む。 ソフトバンクが特定のコンテンツを集約する価値がないと判断したら、あるいは特定の出版社と提携する価値がないと判断したら、そのコンテンツはAIエコシステムに入ってこない。一企業のビジネス判断が、一国のAIトレーニングデータのフィルターになる。

  2. 収益配分の条件はコンテンツクリエイターではなく、ソフトバンクが決める。 日本の新聞社は交渉力のある立場にはない。紙の発行部数は年々減り続けている。デジタル収益はその穴を埋めていない。ソフトバンクが収益還元を提示すれば、それは命綱に見える。だが一度プラットフォームに組み込まれてしまえば、再交渉する力は縮小する。無断でスクレイピングされていた状態から、ソフトバンクが適正と判断した金額を受け取る状態に移行するだけだ。

  3. AI企業が単一のデータ供給者に依存する。 私はAIの領域で競争する:日本の課題でデータ主権の重要性について書き、NvidiaのCEOの助言を引用した。「自分のデータを持ち、自分のAI工場を建てなければならない」と。散在する無許可のスクレイピングを、単一のライセンス供給者に置き換えることは、合法性の改善だ。独立性の改善ではない。

  4. スタートアップや小規模AI企業が締め出される可能性がある。 ソフトバンクのプラットフォームは収益を上げる必要がある。価格設定はソフトバンクの経済原理を反映し、初期段階のAI企業の予算を反映するものではないだろう。もしこれが日本語コンテンツのAIトレーニングデータへのアクセス手段として支配的になれば、資金力のあるAIラボとイノベーションを実際に推進するスタートアップとの格差はさらに広がる。

国立情報学研究所(NII)がllm-jp-3-172b-instruct3をリリースしたときのアプローチと比べてほしい。NIIは正反対の道を選んだ。データもツールもドキュメントもオープン。GENIACプロジェクトを通じて1,900人以上の研究者が協力した。その結果生まれたのは、企業のゲートキーピングではなく、コミュニティの力で構築されたソブリンAIインフラだった。

ソフトバンクのセントラルキッチンは、収益還元のラベルを貼った企業のゲートキーピングだ。

本当に機能するのは何か

現状が許容できると言っているわけではない。AI企業が対価を払わずにコンテンツをスクレイピングすることは問題だ。信頼性の低いトレーニングデータは問題だ。閉じ込められたデータセットは問題だ。だが、診断と同じくらい処方箋が重要なのだ。

  1. 複数の競合プラットフォームが必要であり、一社の独占ではない。 競争が価格を公正に保ち、コンテンツクリエイターに選択肢を与え、単一のゲートキーパーがAIエコシステムに何を入れるかを決める状況を防ぐ。ソフトバンクが1つ構築し、富士通がもう1つ構築し、NTTが3つ目を構築すれば、市場は機能する。ソフトバンクだけが構築すれば、それは料金所だ。

  2. コンテンツの出所に関するオープンスタンダード。 出所追跡の問題は本物だが、解決策はプロプライエタリなプラットフォームではなく、標準規格であるべきだ。メールのように考えてほしい。どのプロバイダーでも実装できるオープンプロトコルであり、一企業が管理するクローズドなメッセージングアプリではない。

  3. クリエイター主導のライセンス。 コンテンツの権利者が自分の作品の使用条件、価格、目的を設定すべきだ。プラットフォームはクリエイターが主体性を持てるマーケットプレイスであるべきであり、ソフトバンクが代わりに交渉する一括購入オペレーションではない。

  4. 政府がフレームワークを設定すること。 日本はアメリカの商業優先アプローチとヨーロッパの規制優先アプローチの間でバランスを取る、私が以前「第三の道」のガバナンスモデルと呼んだものを発展させてきた。まさにこのような課題こそ、一企業にマーケットプレイスの設計を任せるのではなく、政府がゲームのルールを定めるべき場面だ。

  5. データ加工の透明性。 コンテンツが「セントラルキッチン」で加工されるなら、コンテンツの権利者は自分の作品がどう変換され、誰が消費し、収益がどう計算されたかを正確に確認できるべきだ。仲介者によるブラックボックス処理はアカウンタビリティではない。

私にとって居心地の悪い問いかけ

自分自身のポジションについて正直に言わなければならない。複雑だからだ。

コンテンツクリエイターとしては、自分の作品に対する対価と出所追跡を望んでいる。ソフトバンクのプラットフォームはそれを約束する。

AI会社を経営する者としては、信頼性が高く法的に明確なトレーニングデータを望んでいる。プラットフォームはそれも約束する。

だが、この2年間、日本にはオープンで分散型のソブリンAIインフラが必要だと主張してきた者として、ファシリテーションを装った中央集権化に喝采を送ることはできない。

ソフトバンクの現状認識は正しい。対価なきスクレイピング、出所追跡の欠如、信頼性の低いデータによるAI出力の汚染。これらすべてに修正が必要だ。

だが、それを修正するために仲介者の独占を構築するのは、渋滞を解消するために料金所を設置するようなものだ。道路の車線数は変わらない。一つ余計に取り分を取る存在が増えるだけだ。

日本のAIの未来は、データへのアクセスをどう構造化するかにかかっている。正しくやれば、スタートアップも大企業もイノベーションを起こせる多様で競争力のあるエコシステムが生まれる。間違えれば、一社がパイプラインを支配し、他の全員が家賃を払うシステムになる。

私がどちらの中で構築したいかは、明らかだ。

この記事をシェア

🚀 Kafkai を搭載