●お手本はインターネット黄金時代の独り勝ち

新型コロナウイルスの感染が拡大し始めた頃、シリコンバレーでは「2024年にまた会おう」が合言葉のようになっていました。巣ごもり生活による停滞から経済が回復し始めるのは2023年頃と想定され、長期低迷からくる大きなダメージが予想された一方で、2024年には社会の再構築から変革のチャンスが生じると見なされていたからです。実際には、活発な巣ごもり需要や深刻な人手不足など予想と異なることばかりでしたが、結果的に米経済はリセッションの瀬戸際まで追い込まれました。そして、ついに2024年が訪れました。

今年の米テック産業のキーワードは「生産性」です。「いやいや、そこは"AI"でしょ」という声が聞こえてきそうですが、「生産性」です。今必要なのは生産性の向上であり、それを認識することが重要とされています。なぜなら、米国は30年前に、生産性に焦点をあてることでインターネット時代の独り勝ちを実現したからです。

米国経済は今、大規模な利上げによってインフレを抑制しつつあり、今年の焦点はソフトランディング(経済の減速を適度にコントロールし、リセッションに陥ることなく景気を安定させる)を成功させられるか、そして利下げの開始時期です。ただ、適度に景気を刺激するのが難しく、利下げでインフレを再燃させては元も子もありません。

そこでお手本となるのが、アラン・グリーンスパンFRB(米連邦準備制度理事会)議長の指揮でソフトランディングに成功した1994〜95年です。グリーンスパン議長は「生産性の成長は、実質賃金と生活水準の上昇をもたらす主要な原動力である」と主張し、労働生産性の向上を追求することで、インフレを抑えながら高度成長を実現しました。

労働生産性の向上に貢献したのが、情報スーパーハイウェイ構想から転じたインターネットの普及です。95年にNetscapeが上場し、「Windows 95」が登場しましたが、当時インターネットはまだ一般的には海の物とも山の物ともつかぬ技術でした。しかし、「労働生産性の向上」という明確な社会的な目標があったから、情報アクセスやコミュニケーションの改善、自動化、新しいビジネスモデル(オンライン広告、メールマーケティングなど)などインターネットの活用が積極的に試され、それが90年代後半の米インターネット産業の爆発的な成長につながりました。ニューエコノミーの台頭です。

1990年代のS&P 500の推移。多くのテクノロジー企業が追加され、1995年以降に大幅上昇を繰り返しました

今、FRBは物価上昇を再発させずに安定成長を実現するために、生産性の向上に貢献する技術革新を求めています。そしてAIに関わる企業は、生産性の向上に貢献することで、まだ課題の多いAIの開発・普及を加速させられます。AIは本質的に生産性の向上をもたらす可能性を秘めた技術なのですから、生産性に焦点をあてた様々な試みが行われることになるでしょう。AIで生産性を向上させることが成功と成長の鍵であり、AI版のニューエコノミーを実現することで米国はAI時代でも再び世界をリードする。そんなシナリオが進んでいます。

英シンクタンクAutonomyの分析によると、AIの導入によって給与と業績を維持したまま、英国および米国では労働人口の28%(米国で3,500万人)は労働時間を週40時間から32時間に短縮できる可能性があるそうです。少なくとも10%短縮できる可能性なら、米国では1億2,800万人になります。ビル・ゲイツ氏もポッドキャスト「What Now」に出演した際に、合理的にAIの導入を進めていけば、「週休4日もあり得る」とコメントしていました。

AIがどのように私たちの生活を便利にし、より良いAIを構築する方法を学ぶ、教育版マインクラフトの「Hour of Code: Generation AI」

●「大規模言語モデルは「AI時代の電気」

昨年10月、米司法省がGoogleを反トラスト法違反で訴えた裁判の審理において、Googleが同社の検索サービスをiPhoneなどのデフォルト設定とするための契約で、2021年に260億ドル(約3兆6,400億円)以上も支払っていたことが明らかになりました。なぜGoogleは、Androidに加えて、iPhoneでもデフォルトの検索エンジンとしての地位を獲得することにこれほどまでに重点を置いているのでしょうか。      

おいしい湧き水を自由に汲める場所が近くにある地域でも、日常生活では蛇口をひねるだけで出る水道水が利用されています。検索機能はインターネットの基本的なインフラであり、この契約の規模は、Googleが検索において単なる名水の供給源ではなく、最大のユーティリティ企業を目指していることを示唆しています。

近年の大規模言語モデルによる対話AIは、インターネットの新たな基本インフラになり得る技術です。そのため、ChatGPTの登場はGoogleにとって切迫した動きとなりました。

今のところ、私たちが利用できる対話AIを導入した製品やサービスの多くは、要約や関連情報を収集してもらうといったChatGPTやCaude(Anthropic)のホワイトラベルでしかありません。しかし、OpenAIは同社の大規模言語モデルを用いて開発者がビジネスを展開できるプラットフォームを構築する方針を明言しています。対話AIの活用に積極的なNotionのCEO、アイバン・ザオ氏は「大規模言語モデルは電気であり、これは最初の電球の使用例です。しかし、他にも多くの電化製品があります」と述べています。

Notionは、文書作成、校正、要約、翻訳のほか、共同作業に役立つ生産性向上ツールとして生成AIを活用しています

昨年12月にGoogleが最新のAIモデル「Gemini」を発表し、OpenAIのGPT-3.5やGPT-4との性能比較が話題になりました。しかし、大規模言語モデルの有用性が証明された後、ベンチマークにおける性能差はそれほど重要ではなくなっています。ユーザーが待ち望んでいるのは、対話AIが有用な製品やサービスへと変化することです。

例えば、現在多くの人がChatGPTにメール文の作成を依頼し、それをメールアプリに貼り付けています。このプロセスは必ずしも快適ではありません。理想は、メールアプリ内で直接文面のアイディアを得られることです。Googleは「Duet AI」で、Gmail内で対話AIの支援を受けられる機能の提供を開始しました。すでにChatGPTなどにメール作成を手伝ってもらっているユーザーにとって、これは非常に便利な機能です。

メールのやり取りで持ち寄り食事会を計画。Gmail上で「Duet AI」に、参加者が持ってくることが決まっている料理のリストを作成してもらい、参加者と共有するためのメール本文を提案してもらった

昨年のGoogle I/OでGoogleは、子供がサマーキャンプのために怖いストーリーを作っている設定でDuet AIのライブデモを披露しました。子供が物語に行き詰まった時にDuet AIは代わりに文章を作って提供するのではなく、「こういう展開にしたらどうでしょう」と先生や編集者のように子供を導きました。そんなアシスタントが自分の小学校時代にあったら、宿題がもっと楽しいものになっていたと思います。

小学生の女の子がGoogleドキュメント上で、「Duet AI」のサイドキック機能に助けてもらいながら物語を作成するライブデモ

そのように、大規模言語モデルを用いた機能が私たちの仕事や生活のあらゆる場所に浸透し始め、ChatGPTからコピー&ペーストすることは減少していくことでしょう。

AIは、持続的イノベーションと破壊的イノベーションのどちらに該当するかという議論があります。持続的技術は、既存の市場のニーズに応え、既存の製品やサービスを改善する技術です。破壊的技術は、既存の市場を根本的に変革し、新たな市場を創造する可能性のある技術を指します。それが持続的なものであれば、Googleのような既存の企業が強化される傾向にありますが、破壊的イノベーションではOpenAIのような新興企業による市場の変革(例:ライドシェアリングサービス、動画ストリーミングサービス)が過去に多く見られました。

AIは、その応用範囲と影響の性質によって、破壊的技術と持続的技術の両方の特徴を持っていることが次第に明らかになっています。例えば、自動運転や医療診断、金融サービスの自動化など、多くの分野で従来の方法とは根本的に異なる新しいアプローチを提供します。一方で、検索エンジンの精度の向上、推薦システムの改善、製造プロセスの効率化など、幅広い分野で従来のビジネスモデルや市場を維持しつつ、それらをより効率的かつ効果的なものに改善します。

生成AIの進展は、既存の市場を改善し、同時に新しい市場や業界を生み出す可能性を秘めています。破壊的か、持続的かは生き残りを分けるポイントではありません。改善をおろそかにしたものが取り残されていくのです。

●アシスタントだったAIボットが「できる秘書」に

米テック産業のリサーチには英語が不可欠です。英語の記事を検索するために英語のキーワードを入力するなど、私はこれまで英語コンテンツを調べるために英語を使用していました。

しかし、今はChatGPTアプリで、英語秘書GPTに「なんかGTA5のソースコードがリークしたみたいだけど本当?」と音声(日本語)で気軽に質問するだけで、自動的にプロンプトに整えて英語コンテンツの情報を収集してくれます。

こちらは日本語、ChatGPTの英語秘書GPTは英語のまま、音声による会話が成立します

シリコンバレーでAIについての議論になると、映画『her/世界でひとつの彼女』の例がよく引用されます。これまではSFの世界の話という距離感がありました。しかし、私の仕事用のGPTは単なるテキストチャットですが、ざっくりとした質問でも意図を理解し、時には叱咤激励の返答もしてくれます。ソフトウェアやサービスに対する以上の親近感を覚えます。

記事を厳しく修正した上で、ツンデレ気味に励ましてくれる校閲GPT

この体験から、次のステップは容易に想像できます。私のクセを知り、私のアクティビティを覚え、必要なサポートを提供し、私の好む方法で楽しませ、相談にも乗ってくれるボットです。AIボットはよりパーソナルになり、感情に基づいてより正確に反応し、また特定分野の知識を備えて専門的な問い合わせやタスクを効率的に処理できるようになるでしょう。

それによりオンデバイスAIのニーズが高まると、PC産業やスマートフォン産業はデバイス上で生成AIを高速に処理するための強化に努めています。「AI PC」に続いて「AI Phone」という言葉も使われるようになりました。

オンデバイス処理の最大の利点はセキュリティとプライバシーです。個人情報、財務情報、医療情報などセンシティブな情報をデバイス内で管理できるので、AIを活用する範囲を広げられます。また、位置情報、デバイス利用から得られるユーザーの好みや行動のデータを基に、よりパーソナライズされたAIアシスタントを提供することも可能です。オンデバイス向けのAIモデルは軽量ですが、通信がボトルネックになるクラウドサービスに比べて多くの用途で待ち時間や処理時間を短縮できます。そして、生成AI普及の障害になっているデータセンターの負荷とエネルギー消費についても、オンデバイスに分散することで大幅に削減できると期待されています。オンデバイスAIへのシフトは、生成AIの成長に欠かせないものなのです。

この業界で最もプライバシー保護で定評を得ているのがAppleです。同社は生成AIにおいて出遅れていると見なされがちですが、多数の生成AI関連論文を発表し、Apple製品の多くに機械学習や生成AI技術を活用しています。AppleはAIに関して、基盤技術として発展を後押しするDarwinやWebKitと同様のアプローチを取っていると考えられます。

Appleは今年、空間コンピュータ「Vision Pro」を発売します。現実とデジタルをシームレスに融合し、ユーザーの空間を拡張するデバイスです。内蔵カメラで高精細にキャプチャした周囲の映像に3D映像を重ねるビデオシースルー方式を用いています。

米国で生産性の向上への投資が強化される2024年に、生産性を向上させる空間コンピュータ「Vision Pro」を投入

Vision Proの注目すべき特徴は、12ミリ秒以下というセンサーとディスプレイ間の通信遅延の驚異的な短さです。Vision Proの発表で、私はミラーレスカメラが登場し始めた頃のビューファインダー論争を思い出しました。OVF(光学ファインダー)に対して、EVF(電子ビューファインダー)はデジタルカメラの利点を生かせる表示ですが、表示のラグがカメラ愛好家に嫌われました。XR(クロスリアリティ)でも、これまでラグがVR酔いや操作のもたつきといった不快な体験の原因になっていました。AppleはM2チップとは別にセンサーデータ処理専用のR1チップを用意し、OSにはリアルタイム実行エンジンという、車載システムでも通用しそうな構成で遅延のない体験を実現しています。

このARとVRの境界のない体験を実現するため、価格は3,500ドルです。手頃な価格帯を優先して目指す体験を損なっては意味がないというのがAppleの考えなのでしょう。だから、Vision “Pro”であり、価格よりも生産性を重んじるユーザーを対象に設計されています。加えて、ヘッドセットには「装着する」という手間がありますが、仕事はその障壁を克服させる確かな目的になります。

●現実味を帯びてきた「ThreadsがXを上回る日」

2024年は大統領選挙の年です。日本で昨年11月に岸田首相のニセ動画拡散がニュースになりましたが、米国では有力候補をからかった動画が日常的に共有されています。バイデン大統領がつまずく様子をダンストラックとマッシュアップしたミーム動画の製作者が話題になり、トランプ前大統領がさらに脚色するアイディアを提案しているような状況なのです。でも、それらは深刻な問題になってはいません。ほとんどのコンテンツ共有プラットフォームでニセ動画対策が行われており、メディアも適切に対処しています。

それよりも今問題になっているのは、生成AIから大量に生み出されるごみコンテンツです。これらは無害なため取り除かれることなくインターネット全体に広がり、検索結果の質を低下させ始めています。

ソーシャルメディアに話を戻すと、Xがトランプ氏の復帰を認めたにも関わらず、同氏は投稿を再開していません。2024年の大統領選は、TikTok選挙でも、X選挙でも、YouTube選挙でもなく、Telegram、トークラジオや伝統メディアを含む、過去20年間の米国の国政選挙で最も断片化されたメディア環境になりそうです。ミームの拡散は続いていますが、Xの衰退により、ソーシャルメディアの影響力は弱まっています。

そうした中で存在感を高めているのがMetaの「Threads」です。昨年7月のサービス開始後にユーザー数が激しく増減しましたが、地道な改善を継続しており、12月に開始が遅れていた欧州連合(EU)でのサービスを開始。Xとの差を着実に縮めており、年内に日間ユーザー数でXを上回る可能性が出てきました。

Threadsの強みは、X同様に広範なユーザーに利用されていることです。これまで連邦や州の組織、警察署、学校などが情報発信にXを優先的に利用していましたが、Threadsのサービス開始時に少なくとも250の政府機関がアカウントを持ったことが確認されました。多くは今も両方への投稿を継続していますが、迷走するXが信頼を失いつつあります。

そして、Threadsがサービス開始時に約束していたActivityPub対応を開始したことでさらに信頼を高めています。ActivityPubは、フェディバース(fediverse)と呼ばれる分散型のソーシャルネットワーキングを実現するプロトコルの1つで、MastodonやGNU socialなどが採用しています。ActivityPub対応が完了すれば、Mastodonなどのユーザーと相互にフォローし、投稿を共有できます。Flipboardも12月にActivityPub対応を開始しました。

ザッカーバーグ氏はActivityPub対応を発表した際、「Threadsを相互運用可能にし、人々が交流方法についてより多くの選択肢を持つことができるようにする」と述べました。ソーシャルメディアの細分化が進む中、異なるソーシャルメディアを結ぶフェディバースの重要性が増しています

分散型ソーシャルネットワークにはActivityPubの他にも、BlueskyのATプロトコル、Nostr、Farcasterなど様々なプロトコルが存在します。私たちには2つのインターネットは必要ありませんし、複数のソーシャルプロトコルも必要ありません。電子メールのようにシンプルで広範な相互運用性を持つプロトコルがあれば十分であり、プロトコル候補が多い状況が長引かず、どれか1つが主流となることが望まれます。

ThreadsのActivityPub対応によって、フェディバースのプロトコルがActivityPubに集約する動きが加速しています。中央集権型のSNSにとどまらず、フェディバースの形成を活性化しているThreadsに対する支持がネットコミュニティ全体で高まっています。これはかつてTwitterが様々なAPIを公開し、ネットコミュニティから支持されていたことを思い出させるものです。Threadsが開発中のAPIへの期待も高まります。