GoogleのAI開発部門であるGoogle DeepMindが開発中といわれている次世代マルチモーダルモデル「Gemini」はOpenAIのGPT-4に匹敵する性能を持っており、2023年中にリリースされると報じられていました。しかし、IT系ニュースメディアのThe Informationによると、Googleのスンダー・ピチャイCEOによってリリースが来年に延期されたとのことです。

Google Postpones Big AI Launch as OpenAI Zooms Ahead - The Information

https://www.theinformation.com/articles/google-postpones-big-ai-launch-as-openai-zooms-ahead



Google delays its ChatGPT 4 rival 'Gemini' until next year

https://interestingengineering.com/innovation/google-delays-its-chatgpt-4-rival-gemini-until-next-year-over-language-issues

Google DeepMindが開発に取り組む「Gemini」は、Google DeepMindが誇る「AlphaGo」やその発展系「AlphaGo Zero」の技術と大規模言語モデルを組み合わせたもので、Google検索・YouTube・Googleブックス・Google ScholarなどのGoogleサービスで得られる膨大なデータでトレーニングされており、テキストや音声、画像、動画などの複数のデータを取り扱うことができる次世代マルチモーダルAIです。

ChatGPTのライバルと目されるGoogleのAI「Gemini」がリリース間近 - GIGAZINE



GoogleのチャットボットAIであるBardやGoogle Assistantの責任者を務めるシシー・チャオ氏は、Geminiについて「例えば、私がケーキを焼こうとする場合、Geminiは3層のケーキの作り方の手順の絵を3枚描いてくれるのです。インターネット上の写真ではありません。テキストだけではなく画像も使って、人間と会話することができるのです」とコメントしており、Geminiの性能の高さがうかがえます。

Gemini自体は2023年5月に開催されたGoogle I/O 2023の基調講演で、ピチャイCEOの口から存在が明らかにされました。ピチャイCEOは「GeminiはツールとAPIの統合において非常に効率的であり、メモリやプランニングなどのイノベーションを実現するように構築されています」と述べていました。

Opening | Google I/O 2023 - YouTube

2023年11月にピチャイCEOは「私たちはGeminiをできるだけ早くリリースすることに注力しており、Geminiの主要かつ最大のバージョンを完成させている段階です」とコメントしており、Googkeも「私たちの開発するGeminiはいくつかの点でOpenAIのGPT-4と同等かそれを超える基準を満たしています」と述べていたとのこと。

しかし、ピチャイCEOが2023年12月上旬にカリフォルニア・ニューヨーク・ワシントンで予定されていた発表イベントを延期するように指示したとThe Informationは報じています。このイベントは政治家や政策立案者を対象としたものでしたが、ピチャイCEOは「AIが英語以外のクエリの一部を確実に処理できないことがわかった」として、リリースの延期を決定したそうです。



IT系ニュースサイトのInteresting Engineeringは「Geminiのリリースは、Googleの歴史の中でも最も重要なプロダクトのリリースの1つになるかもしれません。Geminiは従来の検索やワールドワイドウェブからチャットボットベースに移行する新しいインターネットを作り出し、さらにGoogleがOpenAIに対抗し得る、あるいは上回り得ることを意味します」と述べました。