最初に、「2025年日本国際博覧会/ EXPO 2025 Osaka, Kansai, Japan」(以下「大阪・関西万博」)について語る資格が、豊田啓介には少なからずあることを明記しておきたい。豊田は、アドヴァイザー/プレゼンターとして、大阪・関西万博の招致にかかわっていたからだ。豊田はこう語る。「モノ(フィジカル)と情報(デジタル)が重なる“共有基盤=コモングラウンド”を構築できれば、日本の産業、ひいては日本の社会はまだ『間に合う』かもしれない。大阪・関西万博は、時期的(6年後)にも規模的(約155ヘクタール)にも、コモングラウンドの社会実装を手繰り寄せる、千載一遇のチャンスになりうる」と。

「建築家・豊田啓介が提唱する「2025年」の意味」の写真・リンク付きの記事はこちら

コモングラウンドとは何を意味するのか? なぜコモングラウンドが「今後の日本」に可能性をもたらすのか? その点に関しては、このあと豊田にじっくりと解説していただく。

その前に、豊田の「建築家としての立ち位置」をあらためて確認しておきたい。豊田は常々、コンピューテイショナルデザインを生かした「建築情報学」の重要性を説いている。いわく、建築とは元来、3次元に固定したものにあらず、時間軸はもちろんのこと、法規、コスト、構造など、さまざまな情報(=数十次元という高次な情報)を扱わねばならない。だとしたら、建築とはそもそも「物理的な存在」ではなく、「情報的な総体すべて」と捉えるべきであり、当然建築家には、「情報のすべて」を扱う職能が求められる……というわけだ。そうした高次の情報は、これまで「師匠と弟子」が長い年月をともにすることで、勘や感性のようなかたちで共有されるか、2次元のドローイングや3次元のモデルへと「低次元化」することで客観化されてきた。しかし、デジタル技術の登場により、身体のなかにある「ドロドロとした高次元の情報」の一部は、そのまま記述することができるようになってきたと、豊田は捉えている。

豊田がここで言う「情報」には、前述のさまざまな要素やBIM(Building Information Modeling/コンピューターで作成した建物の3Dデジタルモデルに、形状や材料の数量、コストや仕上げ、あるいは周辺地理といったさまざまな属性情報を追加し、そのデータベースを建築設計、施工、維持管理といったあらゆる工程において活用するためのプラットフォーム)に加え、建築や都市をセンシングするために不可欠となってきたLiDAR(Light Detection And Ranging/レーザー光線を利用し、高精度でXYZ計測値を生成する光学リモートセンシング)をはじめとする、多岐にわたるデジタルインプットのノウハウや情報処理、人工知能(AI)に対する知見なども含まれている。

万博、日本の産業と社会、建築、都市、情報、センシング……。そうした要素を包み込む、「モノ(フィジカル)と情報(デジタル)が重なる“共有基盤=コモングラウンド”」の価値/意味を、豊田はどう定義しているのか。あらかじめ伝えておくと、それは、エストニア出身の生物学者ヤーコプ・フォン・ユクスキュルが提唱した「環世界」の、デジタル版と捉えられるかもしれない。そして、そんなデジタル環世界を「記述」するのに最適なのは、どうやら、ゲームエンジンのようだ。

今日日の「情報プラットフォーマー」は都市を買う

豊田啓介:近年の産業の変遷、具体的にはプラットフォーマー企業の変遷について考えてみたとき、1980年代のバブル期のピークでは「世界の時価総額ランキング上位20社のうち、十数社が日本企業」でした。そしてランクインしていた会社の多くは、トヨタや日立やパナソニックなどの「ものづくり企業」でした。これを第一世代と呼びたいと思います。

それが第二世代、つまり90年代以降にヤフーやグーグルといった情報プラットフォーマーが登場し、価値が「モノ」から「情報」側に一気に振れた途端、瞬く間に日本のものづくり企業は時代遅れになってしまいました。基本的に、その状態がいまも続いているのだと思います。

ヤフーやグーグルの次に出てきたのが、「情報プラットフォーマーとしての知見と技術をもっているけれど、あくまでモノを扱う企業」です。いまだとアマゾンやアリババが代表的でしょうか。彼らはいまや、企業価値という意味では世界最大級ですが、これが最終形態かというと、そんなことはありません。モノといっても、彼らはただ「ボックスに入ったモノ=可動産」を動かしているにすぎませんから。

可動産を扱っていた第三世代に続いて登場した第四世代は、不動産としてすでに街に存在していたタクシーなりホテルなりオフィスというものを離散化し、それらを物理的に動かすのではなく「意味や価値のほうを編集」して、情報プラットフォーマー的に扱い始めました。UberやAirbnb、WeWork等々です。物理的な「モノ」の代わりに「情報」を動かすことは、モノ自体を動かすよりも圧倒的に効率的で経済的です。じゃあ彼らが最終形態なのかというと、そうでもありません。現実世界の複雑度というのは圧倒的なので、最新の技術を使ったとしても、Uberはタクシーだけの離散化だし、Airbnbは宿泊場所の離散化だし……といった具合に「単一領域」しか扱えていません。

こうした流れをふまえると、次の第五世代は、当然「都市の既存領域を複合的に扱える世代」になるはずです。実際、最近の投資の状況などを見ていると、巨大なカネと技術をもっている第二〜第四世代の企業が、明らかに、第五世代のプラットフォームになりそうな領域に莫大な投資をしていることがわかります。代表例が、グーグルのグループ企業であるSidewalk Labsが、トロントのウォーターフロントで進めている再開発でしょう。

このスマートシティプロジェクトは、トロント市が依頼したわけではなく、グーグル側が数千億円という持参金を市に払うことで権利を買った実証実験にほかなりません。

グーグル以外にも、マイクロソフトがアリゾナ州ベルモントに新しい都市をつくると言っているし、アリババも、お膝元である杭州市を街ごと「購入」して交通やセキュリティ制御を中心とした実装を進めているようですし、ダッソーなどのBIMメーカーも、ヴァーチャルシンガポールというかたちで政府とデジタル化の実装を進めています。要は、第五世代へ行くためには、「都市を買う」くらいの規模じゃないと、実証実験ができない時代になってきているわけです。統計的なデータと市民の日常生活がインテグレートしていないと、第五世代プラットフォーマーとしての技術構築ができないからです。

こうした傾向は、価値軸が「情報からモノ側に帰ってきている」証拠になると思います。言い換えると、情報プラットフォーマーである第二〜第四世代が「どうやらオレたち、モノのつくり方やモノを扱うノウハウを知らないんだな」ということに気がつき始めた、というわけです。それはつまり、第一世代の「ものづくり企業」がもっている、時代遅れだと思われていた技術が、金鉱脈化しているということにほかなりません。ただ、第一世代の企業は情報プラットフォーマーとしての言語をもっていないので、コミュニケーションができず、宝の持ち腐れになっているわけです。

第一世代の行く末に関しては、正直、情報プラットフォーマーとしての技術を身につけて一気に第五世代へ飛ぶか、あるいは、第二〜第四世代に買収されることで第五世代の枠組みに入るかのどちらかだと考えています。とはいえ、グーグルがいきなり、トヨタのエンジンのつくり方とかクッションのつくり方みたいなことを身につけられるかというと、意外と簡単なことではなくて、自前でやったら少なくとも10年はかかるとみています。日本のものづくり企業にしてみれば、この「猶予期間」をどう使うかが、ものすごく大事になってくるはずです。では、一気に第五世代へと飛ぶためには何が必要なのか。先程、「第一世代の企業は情報的な言語をもっていない」と言いましたが、ぼくは、都市をデジタル記述したり、モノのデータをリアルタイムに扱ったりする「モノと情報を接続するノウハウをもつこと」が、第五世代への近道だと考えています。そのために必要なのが「コモングラウンド」なんです。

インタヴューは、クリエイティヴ集団PARTYのスタジオで実施。LiDARやKinect、サーモグラフィなど、いくつかのデヴァイスで豊田をセンシング/スキャニング。デジタルエージェントが見ている世界を擬似構築した。

コモングラウンドは「デジタルツイン」ではない

コモングラウンドとは、そもそも、京都大学大学院情報学研究科の西田豊明教授が「2018 年度人工知能学会全国大会」の基調講演に向けて記したこの一文にインスパイアされた言葉です。

「人間社会が人工知能のもたらすベネフィットを最大限に享受できるようにするためには、人間社会と人工知能がともに依拠できる『共有基盤(Common Ground)』を構築し、発展させていく手法を確立することが不可欠です」

西田教授は、会話言語学のフィールドにおいて「人間とAIの共有基盤をつくろう」とおっしゃっているわけですが、ぼくらは点群データやLiDARをはじめとする、建築や都市をセンシング/スキャニングするさまざまな「デジタルインプット」と、「ぼくら人間の認識」が一致している状況こそがこれからは最重要で、それにはコモングラウンドという言葉がぴったりだと考えたわけです。

デジタルエージェント側が世界をどう見ているのかは、それこそ千差万別です。だから「できるだけ汎用的に記述してあげるノウハウをもつ必要がある」という認識を、人間側がもつことがまず重要です。そうすることで、物理世界というか日常世界そのものがユーザーインターフェイスとなり、モノとその構造は、情報のエクスチェンジのためのデヴァイスになるわけです。

コモングラウンドの話をして、よく混同されがちなのが「デジタルツイン」です。デジタルツインは、複合的な情報を感覚的かつリアルタイムに把握して扱うには最適な構造です。データを読むだけではなく、好きなスケール、好きなかたちでズームしたりフライスルーしたり、「何がどこにあるのか」「どういう関係性なのか」といったメタ情報を感覚的に扱うことに関しては、圧倒的に優れています。ただしデジタルツインは、あくまで物理世界を情報的にコピーしたものにすぎません。そこにインタラクションというか、センシングやアクチュエーションといったものが能動的に入り、双方向にコミュニケーションできる状態になっているのがコモングラウンドです。

一方に「リアルワールド」(=モノ)があり、もう一方に「デジタルワールド」(=情報)がある。その中間領域に「モノと情報」が重なりあうような、建築や都市をセンシングしたデジタルツインを能動的に扱える「共有基盤」を、独自の構造として置く。それが、ぼくらがイメージしているコモングラウンドです。ケヴィン・ケリーの言う「ミラーワールド」は、このコモングラウンドを、リアルワールド側から眺めている状態のことだと認識しています。

こうした意味でのコモングラウンドは、ぼくの知る限りまだ存在していません。「それをつくるところが新しい投資領域なんです!」と、とりわけ第一世代にかかわる企業のみなさんには声を大にしてお伝えしたいところです。

価値が「モノ」から「情報」側に一気に振れた途端、日本のものづくり企業は時代遅れになってしまいました(豊田)

大阪・関西万博は、奇跡のタイミングで訪れる

コモングラウンドをつくるためには、まずは街を、そして世界を、デジタル記述していく必要があります。デジタルエージェントというのは、モノをデジタルに認知できなければ、空間に置かれたイスひとつすら認識できません。それらを一つひとつデジタル記述してあげることからしか、始まらないんです。例えば今後、社会に自律走行を普及させるとして、「その技術を担うデジタルエージェントから、この世界がどう見えているのか」という視点で街をつくらない限りは、デジタルエージェントと人間の幸せなコミュニケーション/インタラクションは生じません。日本企業の視点としてはそうした作業を、残されているかもしれない「猶予期間」の間にやってしまうことが非常に重要で、6年後にやってくる大阪・関西万博は、ギリギリ間に合う時期に奇跡的に訪れる、とんでもない実証実験の機会なんです。

考えてみてください。グーグルやアリババに対抗するような単一の巨大企業は、いまの日本にありません。さらに、やすやすと「購入」できる都市もありません。だとするなら「半年間だけ仮設でつくり、何千万人も来場者が訪れ、でも、そのあとに壊しちゃう前提で、ある程度の社会的失敗も許される」といった実験都市を企業や業態を超えて実装する機会には、とんでもない価値があることがご理解いただけると思います。その機会が、ちょうど1〜2サイクルほどの開発が可能なタイミングで大阪へやってくるわけです。大阪・関西万博は、日本のものづくり企業が第五世代へと移行する、つまりは「世界をリードできるスマートシティプラットフォームを日本発でつくる」ための、おそらく二度とあり得ない機会なんです。

建築や都市をセンシングしたデジタルツインを能動的に扱える「共有基盤」を、独自の構造として置く。それが、ぼくらがイメージしているコモングラウンドです(豊田)

ゲームエンジンが都市を記述する

都市をデジタル記述し、それを能動的に扱っていくにあたり、鍵となるのがゲームエンジンだとぼくは考えています。その現状を確かめたくて、先日、エピックゲームズで建築領域を担当しているケン・ピメンタルを訪ねました。エピックゲームズは、ゲームエンジンにおいてUnityとシェアを二分するUE4(Unreal Engine 4)の開発元です。ケンによると、非ゲーム領域でゲームエンジンを活用する事例は急速に増えていて、この1年間だけでも26万人がゲーム以外の用途で新たにUE4を使い始め、しかもそのほとんどが建築関係だそうです。

KPFというアメリカの超巨大建築設計事務所がUE4を使って都市全体の3Dデータをつくっていたり、スウェーデンのチャルマース工科大学が、風の強さとか気温といった都市環境のリアルタイムシミュレーションをUE4でやっていたり、Northdocksというドイツの化学プラントがリアルな3DモデルをUE4でつくり、さまざまな情報をリアルタイムにデジタルツイン上で運用していたり……といった数多くの事例をケンは紹介してくれました。ちなみにケンいわく、残念ながら詳細を話せないけれど、彼の知る限りいま最も複合的で先進的なプロジェクトを進めているのは、中国のテンセントだそうです。

「スマートシティを扱いたいなら、とにかく、あらゆるデータをUE4に移行することから始まるはず」と、ケンは言っていました。確かにその通りで、ゲームエンジンは、もともとプレイヤーに遅延を感じさせることなく、できるだけ多様な環境を常に新鮮な形で記述することに特化しています。その点、BIMやCADといった建築向けのエンジンは建設データの詳細なアーカイヴなので、サクサク動くことを前提にしていないし、データも網羅的なのでとても固くて重くなります。さらにゲームの場合、パスを生成するナヴィゲーションAIとか、全体を制御するメタAI、あるいはキャラクターAIが、その環境のなかでどう周りを読んで動かすかといったことを市販ベースで実装しています。そうした技術はそのまま、例えばデジタル記述された世界のなかで「自律走行のパスをリアルタイム生成する」ことに活用できるはずです。

いまはまだ、環境なら環境、交通なら交通といった具合に、単一領域のシミュレーションにとどまっていますが、ゲームエンジンは今後、それらを複合的に記述するだけではなく、人の動きや物流などもリアルタイムで取り込んで記述できるインターフェイスになっていくと思います。それに加え、賃料や税収といった動的なシミュレーションを形態生成にフィードバックすることで、都市や建築の形状や構成を、ジェネラティヴに逆生成できるようにもなっていくはずです。

課題があるとすれば、BIMデータがもつ、構造や設備といった見えないデータから、壁や窓、ガラスやヒノキ、製品名や型番といった属性情報までをどうやってゲームエンジンに持ち込むか、という点でしょうか。さらに言うと、BIMやCADといった建築データがカヴァーしていない道路や広場など、そもそも3Dデータが存在しない既存領域のデジタル化と、そのスキャンデータのゲームエンジンへの取り込みをどうするかという点も、非常に重要な領域です。レーザースキャンは正確なスキャニングを行なえます。最新のシステムは非常に正確で、最近ではスマートフォンでもシンプルな機能を使うことができます。しかし、点群データ(これはレーザースキャンの結果自動的に生成される3D記述のタイプです)は大変重く、物体を識別するのが容易ではありません。デジタル3Dフォーマットはたくさんあって、そのどれもに利点と欠点があります。それらを結合してより汎用性の高いフォーマットにするという挑戦は始まったばかりであり、その主要な推進力のひとつとなるのが、コモングラウンドを築くことです。

実際「異なる形式のデジタルデータ同士をどう変換するか」という問題は、今後非常にクリティカルになると思います。同時に、デジタルデータと物理世界の連動、つまりは多様なセンサーやアクチュエーターによる物理世界とデジタル世界とのリアルタイムな連動が、とても重要になってくるでしょう。最後にそれらの点をケンに尋ねると、「自分たちでは把握できないほどのメタデータが埋め込まれた3Dモデル」というプラットフォームがこれから重要になることは確実で、もちろん、彼らも開発は進めているとのことでした。センサーデータやIoTがらみのビッグデータとの連動に関しては、マイクロソフトやKPFといった企業との連携ベースで取り組んでいくスタンスだとも。「自分たちはIoTのプラットフォーマーではなく、さまざまなデータをつなぐ媒体というイメージをもっている」と語っていたのが印象的でしたね。

「半年間だけ仮設でつくり、何千万人も来場者が訪れ、でも、そのあとに壊しちゃう前提で、ある程度の社会的失敗も許される」といった実験都市を、企業や業態を超えて実装する機会にはとんでもない価値があるんです(豊田)

気になる日本国内の温度感

ケンからいろいろ話を聞き、ゲームエンジンが都市を記述する汎用のプラットフォームになっていくことは、間違いないと確信しました。それはつまり、「コモングラウンドは、ゲームエンジンのかたちで記述される」ということでもあります。だからこそ、国内のゲーム会社さんともいろいろ協力体制を築き上げたくて、「ゲームの開発プラットフォーム以外にも、都市開発プラットフォームとして、ゲームエンジンを戦略的に育てるという視点があってもいいんじゃないか」という話を、ことあるごとにしています。ただ、可能性は感じてもらえるものの、最後には「でもやっぱりゲームの開発に注力したいので……」という話になってしまうんです。なんとももったいないなと感じます。

一方、建築側でいうと、ゲームエンジンを使うというケースは、ゼネコンにしても組織にしても日本ではまだほとんど見られません。シミュレーションというと、日本の場合、構造の専門家が構造解析のシミュレーションをやるとか、環境の人が環境の目的で専門ソフトを使うといった、閉じたシミュレーションしか通常やりません。総合的なプラットフォームを置くことで、その上でいろいろな領域のシミュレーションを走らせられるとか、それをいろいろな人が見て、インターフェイスとしていろいろなものを乗っけられるという長期的な開発の感覚がそもそもないので、ニーズ自体が出てこないんです。

総合的なプラットフォームができれば、その上でさまざまなシミュレーションを走らせることができます。さまざまなシミュレーションが回るようになると、今度はそのシミュレーションを最適化するために、この都市をどう変えていったらいいか、というリヴァースエンジニアリングができるようになるわけです。そうしたノウハウをもつことも、第五世代に向けては非常に大切だと思うのですが、国内の動きは想像以上に鈍く、お隣の中国の動きが見えているだけに、なおさら焦燥感を抱いてしまうのが正直なところです。ぼく自身、gluonでの活動を通じ、いろいろと水面下でR&Dや実装の活動を進めてはいるのですが、都市のコモングラウンド化はいちプレイヤーだけでは到底担えない事業なので、そうした側面からも、大阪・関西万博を大きな契機にするしかないと考えています。

グーグルは挫折気味。日本はどうする?

繰り返しになりますが、単一の超巨大プラットフォーマーの主導によるスマートシティの実証実験が、すでに世界各地で行なわれています。その一方で、「なんで単一企業に生活の全情報を握られなきゃいけないのか」と、市民に反発されるケースがかなり顕在化しているのも重要な傾向です。実際、トロントにおけるSidewalk Labsの試みは、この1年ほど進展を見せていません。現状では、そうした独占的な実証実験が行なわれているのは中国だけで、例えばアリババは杭州市で「ETシティブレイン」というプラットフォームによって市の交通やそのほかの個人データを扱っています。一方ヨーロッパでは、GDPを導入したことからもわかるように、巨大企業の寡占をよしとせず、地方自治体主導で、「ゆっくりとだけれどオープンに、NPO主導で、ソーシャルグッドやエコのためのスマートシティ構築」が複数進められています。代表的なのが、アムステルダムやヘルシンキで進んでいるケースです。ただ、それ自体はすごくソーシャルにいいけれど、現実的には、超巨大IT企業主導のプロジェクトに比べると、資金も技術力も足りない……となりがちなのは否めません。

単一の情報プラットフォーマー型にも、行政主導型にも一難あるわけですが、それらとは一線を画する、「日本型」という考え方がいまならまだありえます。いわば「ものづくりのノウハウとデータの蓄積を生かした異なる業態/レイヤーの企業連合による、オープンプラットフォーム」を構築するやり方です。

領域ごとで言えば、日本企業はまだまだ、世界に通用する技術を充分にもっています。逆に言えば、それなりの競争力と資金力を発揮するためには、単一企業では無理で、分野ごとの融合を前提にせざるをえない、ということになるわけです。これからの時代、融合の前提となる技術体系やデータのオープン化は、プラットフォーム構築と価値創出の大前提になっていくはずです。アメリカや中国のような「単一の情報プラットフォーマー型」とも、ヨーロッパのような「行政主導型」とも異なる、日本的な「企業連合によるオープンプラットフォーム型」は、日本にはそれしか残されていないとはいえ、むしろチャンスなのではないかと思います。

とはいえ、企業に向かって「みなさん連合してください」と正論で言っても無理なことは承知しています。そこで浮かび上がってくるのが万博なんです。万博という旗印があれば、「万博に出展する」という言い訳のもと、時限的な技術協力ができるかもしれない。そうした観点からも、今度の大阪・関西万博は、日本の産業にとって最初で最後のチャンスだと言えるでしょう。

旧来のパビリオン展示中心から、万博でしかできない都市実験と技術実装を主眼とした、新しい万博への価値と構造の転換。それを2025年に実現することが、現時点で唯一日本に残された「次世代型のスマートシティプラットフォームを日本発でつくる可能性」ではないかと思います。

2020年まで、とりわけ建設業界には「オリンピック景気」みたいなものがあり、その貯蓄は2023年あたりまでもつと予測されています。それを、なんとか次の投資、つまりは大阪・関西万博に向けたスマートシティプラットフォームの開発に向けなければいけない。この機を逃したら、おそらく、日本のものづくり産業が再び活況を呈することはないかもしれません。

今回PARTYは、カメラによる撮影に加え、空間や人物のデジタルデータを同時に収録するシステムを構築。人物は、主にKinectで「密なDepth Data」として取得し、空間全体は、VLP16というLiDARを2台使用して「スタジオ全体の空間の情報」を収録した。さらに、サーモカメラと心拍センサーを用いてプレゼンテーション中の豊田の「生体データ」も同録している。あらゆるデータは映像とともに収録されることで、「コモングラウンド」に落とし込まれ、さまざまな視点でヴィジュアライズすることが可能になる。今回のシステムにはTouchDesignerを使用し、重たい位置情報データは、openFrameworksで「Byteデータ」の画像として分割し映像として保存、Shader言語を用いてヴィジュアルとして復元する手法を用いている。上の画像は、同録時の一場面である。

※この記事は英語版も公開されています。英語版の記事はこちら