Vol.134-2

本連載では、ジャーナリスト・西田宗千佳氏がデジタル業界の最新動向をレポートする。今回のテーマはGoogleが発表した生成AI「Gemini」。Geminiをはじめとする生成AIが盛り上がった背景を解説する。

 

今月の注目アイテム

Google

Gemini

↑Googleがマルチモーダルとしてゼロから構築した新しい生成AI。テキスト、画像、音声、動画、コードなどさまざまな種類の情報を一般化してシームレスに理解し、操作し、組み合わせることが可能だ。同社のGoogle Pixelにも採用予定。

 

2022年頃から、IT関連大手の多くが、先を争うように「生成AI」の開発に取り組んでいる。ご存知のとおり、2023年は、ChatGPTのブーム的な盛り上がりもあって「生成AIイヤー」になった。

 

特定の技術が盛り上がってブームになる、というのは毎度のことではある。一方、今回の生成AIブームには、いつもと違うところもある。

 

それは、大手の動きが圧倒的に速いことだ。

 

大手は資金力も人材も豊富なので、後日トレンドに追いつくには有利である。ただどうしても判断から決断までの速度は遅くなりがちで、トレンドの多くはスタートアップ的な企業から生まれ、彼らがリードする形で市場を構成していた。今回もOpenAIが市場をリードしているという意味では、過去と同じとも言える。

 

だが今回、OpenAIとともに市場をリードしているのは大手だ。

 

OpenAIを支えているのはマイクロソフトのクラウドであり、マイクロソフトはOpenAIの生成AIである「GPTシリーズ」を使って自社のソフトやサービスを差別化している。毎月のようにサービス更新を進め、Windows 11やMicrosoft 365といった主要製品への生成AI搭載を始めている。

 

アドビも自社生成AI「Firefly」を3月に発表、すでに何度もバージョンアップを繰り返している。PhotoshopやIllustratorなどの主要製品に搭載しており、しかも操作性はかなり良い。

 

Amazonは国内の場合あまり目立たないものの、音声アシスタント「Alexa」への生成AI導入を発表済み。英語では2024年初頭にもテストが始まる。また、クラウドインフラ部門であるAWSは、AWSでのサービス構築やヘルプデスク構築にチャットとして生かせる「Amazon Q」という独自の生成AIを作っている。

 

MetaはもともとAI研究に積極的だが、現在は「Llama 2」という生成AIを作り、オープンソースの形で公開中。Llama 2を使ったチャットAI「Meta AI」も開発中だが、こちらには用途別に明確な「キャラクター」が設定され、Facebook MessengerやWhatsAppの会話から呼び出し、いろいろなことを質問できるようになっている。

 

そしてGoogleも例外ではない。チャットAI「Bard」を提供し、検索でも、生成AIでのまとめ機能を組み込んだ「SGE」を提供している。その基盤も、2023年5月には「PaLM 2」を発表しつつも、12月初頭には「Gemini」を発表している。

 

挙げてみただけでも、各社が怒涛のように生成AI関連サービスを開発・提供している様がよくわかる。大手がここまで矢継ぎ早にサービスを展開するのは異例のことで、それだけ各社が生成AIの可能性を高く評価しているという証でもある。

 

そしてその背景にあるのは、大手ほど、サーバーを含めた計算資源とその運用予算を豊富に持っている、という点がある。生成AIの開発と学習には高性能なサーバーが大量に必要となるが、スタートアップは規模の小ささゆえに、その確保が難しい。

 

生成AIは現状、大手に非常に有利な状況で展開しているのだが、そのなかでも先端を走るのがOpenAI・マイクロソフト連合だ。Googleはそこに追いつくためにも、他社以上のペースで生成AIの基盤技術刷新を必要としていた……ということができるだろう。

 

では、その新しい基盤となるGeminiはどのような特質を持っているのか? 次回はその点を解説していく。

 

週刊GetNavi、バックナンバーはこちら