写真1枚、プロンプト1発で3D世界を生成。10億ドル集めたWorld Labsに熱い視線
「部屋の写真を1枚撮る。それだけで、ぐるりと歩き回れる3D空間ができあがる」……そんなことが、もう現実に起きています。
テキストから画像を生成できるAIが登場したとき、それはそれは驚きました。動画が生成できると聞いて、また驚きました。では、次に何が来るのか。それは「3D世界そのものを生成する」AIです。
すでにNVIDIA、AMD、Autodeskが賭けている
2026年2月、AI研究者の李飛飛(フェイフェイ・リー)が率いるスタートアップ「World Labs」が、10億ドル(約1500億円)の新規資金調達を発表しました。
出資者の顔ぶれが、このプロジェクトへの本気度を物語っています。チップ大手のNVIDIAとAMD、3DCADソフトの覇者であるAutodesk、投資会社のFidelityやEmerson Collectiveといった錚々たる名前が並びます。
AMDはXの公式アカウントで「空間的に一貫した3D世界の創造という次の成長を探求するチームへの投資を誇りに思う」と祝福のコメントを投稿しました。
彼女たちの創業は2024年9月。李飛飛に加え、機械学習・コンピュータビジョン・グラフィックスの第一人者たちが共同創業者として名を連ねています。すでに累計4ラウンドの資金調達を完了し、AI業界のほぼ全方位から期待を集めているスタートアップです。
創業者の一人である、李飛飛はスタンフォード大学コンピュータサイエンス学部の教授などを務める人物。「Image Net」という研究用データセットを構築したことで頭角を表し、“ディープラーニング革命”の立役者の一人として、その貢献を表されるほど。敬意を込めて「AIのゴッドマザー」と呼ぶこともあるそう。
AIのゴッドマザーたちが作った「Marble」の衝撃
World Labsがこれだけ注目される最大の理由は、2025年11月に正式リリースされた最初のプロダクト「Marble」の存在です。
Marbleを一言で表すと「マルチモーダルな3D世界生成モデル」。テキスト、画像、動画、3Dレイアウトなど、さまざまな入力から、空間的に整合性のとれた高精細な3D世界を丸ごと生成できます。
たとえば、ある部屋の写真を1枚渡すだけで、その空間が360°探索できる3D環境に変わります。
テキストで「霧が漂うファンタジーの城」と入力すれば、リアルタイムで歩き回れる世界が生成される。生成した世界は新しい3D表現フォーマットである「3D Gaussian splatting」や動画としてエクスポートでき、すぐに他のゲームエンジンやVFXパイプラインに組み込めます。
ユニークなのは「Chisel」という編集機能。壁や床などのラフな3Dレイアウトをスケッチした後、テキストで「廃墟のような雰囲気で」と指定するだけでAIが外観を埋めてくれる。HTMLが構造を、CSSが見た目を担当するのに似た発想で、空間の骨格とスタイルを分離しているのが秀逸。
まさに、VRコンテンツを「生成」できる時代が始まっているわけです。
生成AIが現実世界と触れ合い始める
なぜ、ここまで世界が注目するのか。李飛飛の言葉を聞けば腑に落ちます。
彼女は人間の知能を「言語知能」と「空間知能」の2つに分類します。ChatGPTのような大規模言語モデルが「言語知能」を再現したとすれば、World Labsが取り組むのは「空間知能」、3D空間を理解・推論・生成し、その中で行動する能力です。
言語や画像の次に来るのが空間であることは、なんとなく肌感覚でも理解できます。自律ロボット、工場や都市の3Dシミュレーション、映画やゲームの制作現場といったすべてが「3D世界を自動生成できる」技術を渇望している領域です。CADソフトウェアで製造や土木といった現場に強みを持つAutodeskが単独で2億ドルを出資した理由も、ここにあるでしょう。
これらは単なる「3Dコンテンツ制作の効率化」にとどまらない動きだと言えます。
もちろん、ゲームをはじめとしたエンタメ産業への恩恵は大きいでしょう。VFX業界ではHTCとの協業事例において「1日で10種以上の環境を生成・撮影した実績」が早くも上がっています。
ロボット工学の分野では「Marbleで生成した環境をロボットの学習空間として使う」という活用法が模索されています。テキストで任意の環境を瞬時に生成できれば、現実では用意できない多様なシチュエーションでロボットを鍛えることができるからです。
「LLMがAIに考え方を教えたなら、World Labsは存在の仕方を教えている」という表現が、中国テックメディア「IT之家」の記事に出てきましたが、なかなか本質を突いた言い方だと思います。
2D画面の向こう側で言葉を処理していたAIが、3D空間に「住み始める」段階に入った。そして、生成AIは空間そのものを作り始めた。言葉から想像するだけでなくて、言葉から空間を認識できるようになった。
今回発表された10億ドルは、そういった革命への「最初の一歩」への投資です。
Sources: World Labs , AMD , IT之家 , Techcrunch

