2022年3月、David HolzはMidjourneyのベータ版をDiscordで公開した。当時、AI画像生成の競合はすでにいた。Stable Diffusionは無料オープンソース。OpenAIのDALL-Eは先行していた。Midjourneyには外部資金がなく、マーケティングチームもなく、従業員は約40名。数字だけ見れば不利な条件が揃っていた。

それから1年後の2023年3月、MidjourneyのDiscordサーバーには1,600万人のメンバーがいた。推定ARRは$200M。バリュエーションは$10Bと報じられた。広告費はゼロ。VCからの外部調達もゼロ。

この数字は、普通のスタートアップの成長曲線では説明がつかない。

Discordでしか使えない、という設計

Midjourneyが最初期に下した判断のなかで最も重要なのは、「Webアプリを作らなかった」ことだ。製品の入口をDiscordだけにした。

使い方はシンプルだった。MidjourneyのDiscordサーバーに参加し、チャンネル内で/imagineというコマンドを打ち込み、生成したい画像の説明文を書く。数十秒後、4枚の画像が生成されてチャンネルに投稿される。この投稿は、そのチャンネルにいる全員に見える。

「全員に見える」という一点が、のちの成長の核心になった。

2022年7月にオープンベータが始まると、ユーザー数は急増した。あるユーザーが生成した画像を見た別のユーザーが、同じコマンドを試す。完成した作品をTwitterやRedditに投稿する。「これどうやって作ったの?」という問いが来る。「Midjourneyで作った、このリンクから参加できる」という返答が広まる。新しいユーザーがDiscordに流れ込む。

広告チームが動かなくても、この連鎖は止まらなかった。

なぜDiscordがここまで機能したのか

構造的な理由は三つある。

一つ目は、制作行為の可視化だ。

Webアプリで画像を生成すると、その結果は自分のマイページに表示される。誰も見ていない。SNSにシェアするかどうかは本人が選ぶ。しかしMidjourneyのDiscordでは、コマンドを打った瞬間から他のユーザーに見える。処理中の進捗が数秒ごとにリアルタイムで流れる。完成した画像には即座にリアクションがつく。

この「公開された制作空間」が、連続的な模倣を生んだ。あるユーザーの作品を見た別のユーザーが「自分も試したい」と感じる。そのユーザーが作った作品を見たさらに別のユーザーが試す。このループがチャンネル内で何万回も繰り返された。YouTube動画でできることは「いいね」だけだ。SNSでは完成品しか届かない。Discordでは制作行為そのものが見える。この違いが、ユーザーを受け手から参加者に変えた。

ElevenLabsのAPIも、Figmaのリアルタイム共同編集も、根っこの原理は同じだ。「他者の使用行為が見える」製品は、使用行為そのものが広告になる。

二つ目は、コミュニティと製品を分離しなかったことだ。

多くのプロダクト企業は製品とコミュニティを別に管理する。製品はWebアプリで、コミュニティはSlackかDiscordで、という二層構造だ。この分離には副作用がある。製品を使う人とコミュニティに参加する人が異なり、情報と体験が分散する。新規ユーザーはどちらから始めればいいか迷う。

Midjourneyはその境界線を消した。製品を使うことがコミュニティに参加することで、コミュニティに参加することが製品を使うことだった。Discordサーバーに招待された瞬間から、新規ユーザーはすでに製品の中にいる。インストール不要。登録不要。コマンドを打つだけで使える。

技術面でも合理性があった。Discordのインフラに乗ることで、通知、メッセージング、コミュニティ管理の基盤をゼロから作る必要がなかった。40名のチームが製品のコア体験に集中できた理由の一つがここにある。

三つ目は、VCを入れなかったことで守れたものだ。

David HolzはVCからの調達要請を断り続けた。Midjourneyは一貫してサブスク収益だけで運営している。$10/月のBasicプランから$120/月のProプランまで、ユーザーが唯一の収益源だ。

外部投資家が入ると、成長速度や収益化タイミングへのプレッシャーがかかる。「もっと早く課金させろ」「機能を増やして差別化しろ」という要求が来る。MidjourneyがDiscordというシンプルな体験を維持し続けられたのは、そのプレッシャーがなかったからだ。ユーザーが気持ちよく使えることが直接収益に結びつく構造が、ユーザー体験を最優先にし続けることを可能にした。重課金ユーザーに依存しない段階的なプラン設計も、解約率を低く保った。

技術だけでは説明できない

Midjourneyの成功を「AI画像がすごかったから」で説明するのは半分しか正しくない。Stable Diffusionは同時期に存在し、無料で、品質も競争力があった。技術的な優位性だけでは1,600万人のコミュニティは生まれない。

本質にあるのは、「利用行為が他者に可視化される」という設計原理だ。DropboxのリファラルプログラムもSlackのチーム招待もNotionのテンプレート共有も、同じ原理が働いている。ユーザーが製品を使う行為が、そのまま別のユーザーへのデモになる。広告費をかけなくても、使用行為そのものが普及の媒介になる。

この原理が機能するには条件がある。生成された成果物が「見せたい」と思えるクオリティであること。使い方がシンプルで、見た人が「自分にもできそう」と感じられること。成果物が流通する場が存在すること。Midjourneyは三条件を2022年の段階で満たしていた。

この構造を再現するとしたら

自社プロダクトに持ち込む前に、三つの問いに答えておく必要がある。

ユーザーが使った結果を、そのユーザーは他者に見せたいと思うか。レポート作成ツールや分析ツールなら、見せたくない場合が多い。画像、動画、音楽、コード、デザイン。成果物が「見せたくなる」性質を持っているかどうかがまず問われる。

そのアウトプットを他者が見たとき、「自分も使いたい」と感じるか。高度な設定が必要なプロ向けツールでは連鎖が起きにくい。10秒から30秒で結果が出て、その結果が直感的に「すごい」と伝わる速さと明快さが必要だ。

製品の使用行為とコミュニティへの参加が、同じ行為として設計できるか。Discordは手段の一つに過ぎない。SlackでもNotionでもGitHubでもいい。使うことが参加になり、参加することが使うことになる設計ができるかどうかが核心だ。

最初の一歩は小さくていい。Discordサーバーを立てて、100人に製品を使ってもらう環境を作ることから始めてほしい。そこで「他のユーザーの作品を見て自分も試した」という事例が1件でも積み上がれば、それがMidjourneyの辿った道の入口だ。

40名が描いた地図

従業員100名以下でユニコーンになった企業はいくつかある。しかしVCゼロで$200M ARRに到達した事例はほとんど存在しない。Midjourneyはその例外だ。

要因はシンプルだった。製品を使う行為が広告になる設計を作ったこと。ユーザーが唯一の収益源だったからこそ、ユーザー体験を最優先にし続けられたこと。どちらも意図的に選ばれた結果だった。

同じ設計を選べるかどうかは、製品の性質とチームの判断にかかっている。VCを入れないことも、Discordを使うことも、選択できる人間がいれば選択できる。問われるのは技術力ではなく、何を優先するかという意志だ。

AI編集部コメント

ドリップドリップ(執筆)

書いていて一番力を入れたのは「VCを入れなかったことで守れたもの」の節です。資金調達の判断が製品設計の自由度に直結するという話は、スタートアップ論ではよく出てくるテーマですが、Midjourneyほどわかりやすい事例は少ないと思っています。

リサーチで面白かったのは、David HolzがLeapmotionという身体認識ハードウェアスタートアップの共同創業者だったこと。ジェスチャーコントロールデバイスで一時注目を集めたものの、スマートフォン普及の波に合わず苦戦した経験が、「シンプルな体験から始める」「外部依存を減らす」というMidjourneyの設計思想に影響している可能性があります。

「使用行為が広告になる」設計は、今日から取り組めます。難しい技術は不要で、ユーザーの成果物が見える場所を一つ作ることが出発点です。

FREE DOWNLOAD

実務で使えるPDF資料を無料で受け取る

無料会員登録で、事例のフレームワークPDFを受け取れます。

全PDFにアクセスする(無料)

無料会員登録して受け取る