今年もディープラーニングとGPUの世界最大級のイベント「GTC」が開催されている。「GTC2023
」(GTC23)は日本時間の2023年3月21日から24日にオンラインで開催。最先端技術の現場にいる有識者による650以上のセッションが用意されている。参加登録は無料
で、日本語字幕付きのセミナーも用意されている。
そして最も注目されているNVIDIAの創業者/CEOのJensen Huang氏の基調講演(キーノート)が配信された。今回も盛りだくさんの発表が連なっていたが、現在、AI分野で最も注目されている生成系AI(ジェネレーティブAI / Transformer)についての言及があった。それは「ジェネレーティブAI」サービスをクラウドで提供する「NVIDIA AI Foundations」の発表だった。しかも、Googleクラウド、Microsoft Azure、オラクルクラウド(Oracle Cloud Infrastructure)で提供される。
大規模言語モデルを「Nemo」、画像生成AIを「Picasso」、医療分野の生成系AIを「Bionemo」というサービスでクラウドで提供する「NVIDIA AI FOUNDATIONS」を発表
●「ジェネレーティブAI」サービスをクラウドで提供
フアン氏は「ジェネレーティブAI は、AIの急速な採用を促進し、無数の業界を再発明している。「NVIDIA AI Foundations」により、企業は独自のデータを使用して基盤モデルをカスタマイズし、人類の最も貴重なリソースである知性と創造性を生み出すことができる」と語り、「ジェネレーティブAIはほとんどすべての産業を変革するでしょう」と付け加えた。
フアン氏が基調講演で紹介したジェネレーティブAIが生成した「宇宙服を着たネコが月を歩いているリアルな絵」(テキストで指示すると画像を生成する)
●「NVIDIA AI FOUNDATIONSサービス」の発表
生成系AIが注目されている具体的なユースケースは「ChatGPT」に代表される大規模言語モデル、「Stable Diffusion」などの画像生成AI、そして「創薬分野」などでの新しい分子やタンパク質の発見だ。これらの生成系AIは、多くの企業が注目していて、自身のビジネスにどのように活用するかを急速に検討していくと見られている。
そこで、NVIDIAは、大規模言語モデルを「Nemo」、画像生成AIを「Picasso」、医療分野の生成系AIを「Bionemo」というサービスでグラウド提供する「NVIDIA AI FOUNDATIONS」を発表した。
●大規模言語モデルと対話型AI「NeMo」
いま、AI分野で最もホットな話題のひとつである「ChatGPT」について、フアン氏は「ChatGPTで作られたテキスト感動を通り越したものであり、メモや詩を作り、論文をわかりやすく書き換え、数学の問題を解き、契約書の重要な部分を強調表示してくれたり、更にはプログラムのコードも書くことができる」と評価した。
言語生成AIは、文章を生成するだけでなく、対話型AIを進化させ、プログラムコードを書くことができる「NeMo」クラウドサービスはChatGPTのようにテキストを生成する大規模言語モデルで、数兆単位の単語でトレーニング学習されたもの。Transferモデルでは、単語間の依存関係を学習して重み付けをおこなう技術で、その結果、ChatGPTのような体験の基盤となるモデルができあがる。独自の言語モデルを組み込むか、トレーニング済みのNemo言語モデルから生成作業を行うことができる。GPTパラメーター数は80億個、430億個、5300億個があり、独自モデルの生成から運用まで、プロセス全体でNVIDIA AIエキスパートが支援するとしている。
ユーザーは「NeMo」をNVIDIA DGX Cloudで実行することでジェネレーティブAIを短期間で導入することができるようになる。
●ビジネス活用のための不適切発言を監視機能(NeMo)
NeMoクラウドサービスを使用すると、開発者は重点分野を定義し、ドメイン固有のナレッジを追加し、機能的スキルを教えることで、「大規模言語モデル」(LLM) をビジネスに活用できる。ビジネス活用で最も難しいのは、カスタマイズされたブランド固有のコンテンツを的確に提供するとともに、コンプライアンスに反した言葉を返したり、間違った情報を返答しないシステムを構築することだが、フアン氏は「独自のナレッジベースで構築されたモデルに接続することができる」と拡張性と、「会話が脱線せず、不適切な言葉や偏りの表現を自身で監視する」しくみが備わっているため、短期間でビジネス活用が実現することを強調した。
サービスで利用可能な前述のように、80億から5,300億のパラメータのさまざまなサイズのモデルは、追加のトレーニング データで定期的に更新され、企業は速度、精度、およびタスクの複雑さに関するビジネス要件に合わせたアプリケーションを構築するための幅広いオプションが利用できるという。また、NeMoクラウドサービスに含まれる情報検索機能を使用すると、顧客はリアルタイムの独自データでLLMを拡張できる。これによって、企業はモデルをカスタマイズして、マーケット インテリジェンス、エンタープライズ検索、チャットボット、カスタマー サービスなどのための正確なジェネレーティブAIアプリケーションを強化できる。
●画像や動画の自動生成AI「Picasso」
「Picassoクラウドサービスは画像、ビデオ、3Dにわたるシミュレーションとクリエイティブ デザインを効率化するためにな活用できる生成系AI。高精度なtext-to-image、text-to-video、text-to-3D 機能を備えたジェネレーティブ AI 搭載の画像、ビデオ、3Dアプリケーションを構築したり展開するためのクラウド サービスとなっている。
シンプルなクラウドAPIが用意され、創造性、デザイン、デジタル・シミュレーションの生産性を大幅に向上させる機能をクラウドで提供される。ソフトウェアメーカー、サービス ロバイダー、一般企業であっても、Picassoを使用して独自のデータでNVIDIA Edify基盤モデルをトレーニングして、自然なテキストプロンプトから、製品設計、デジタルツイン、ストーリーテリング、キャラクター作成など、さまざまなユースケースのビジュアルコンテンツを作成するアプリケーションが構築できる。
一般にこの分野で議論の的となっているのが、AIが他者の著作権を侵害したデザインを生成してしまうケースだが、完全にライセンスされたデータで事前トレーニングされたPicassoの一連のEdifyモデルを活用することもできるという。さらに、Picassoを独自の生成AIモデルの最適化や実行に活用することもできる。
AIが生成したリアルな画像
AIが生成したリアルでファンタジーな画像
●アドビ、Getty Images、Shutterstockらがパートナーに
フアン氏は、クリエイティブ業界の有力な企業との連携も発表した。NVIDIA と Adobe:
はこの日、従来からの研究開発パートナーシップを拡大し、次世代のジェネレーティブAIモデルを作成することを発表した。両社は、Adobe のContent Authenticity Initiativeを活用して、透明性とコンテンツ資格情報に重点を置いてモデルを共同開発する。クリエーターやマーケティング担当者のワークフローを加速するために、これらのモデルのいくつかは共同で開発され、Photoshop、Premiere Pro、After Effects などの Adobe Creative Cloud の主力製品やNVIDIA Picasso を通じて市場に投入される予定だ。
また、ストック写真業界の大手であるGetty Images:
は、責任あるジェネレーティブな text-to-image および text-to-video の基盤モデルをトレーニングするために協力する。モデルは単純なテキストプロンプトを使用して画像とビデオを作成できるようにし、Getty Images の完全にライセンスされたアセットでモデルをトレーニングする。Getty Images は、モデルから得られた収益に対してアーティストにロイヤリティを提供する。
Shutterstock:
は、ブランドやメディア企業向けのグローバル クリエイティブ プラットフォームとして知られる。Shutterstock は、詳細な3Dモデルの作成を簡素化し、3Dモデルの構築に必要な時間を数日から数分に短縮するために、Picassoサービスを使用してジェネレーティブな text-to-3D の基盤モデルをトレーニングするために協力する。ライセンス供与されたShutterstock のアセットとメタデータがトレーニングに使用される。Shutterstock はContributor Fund (寄稿者基金) を通じてアーティストに報酬を支払うしくみだ。展開の準備が整ったら、Shutterstock はそのプラットフォームでモデルを提供して、クリエイティブ制作のための3Dアセットの作成を簡素化し、NVIDIA Omniverse での産業用デジタルツインや3D仮想世界構成の開発を加速する予定だという。
●医療分野のジェネレーティブAI「BioNeMo」
ジェネレーティブAI「NeMo」の医療分野に特化したクラウドサービスが「BioNeMo」と言えるだろう。フアン氏によれは「生成AIモデルはタンパク質のアミノ酸配列を読み取れるようになり、数秒で標的とするタンパク質の構造が正確に予測できるようになった」という。
そして、体内での薬の挙動を最適化するADME特性を持つ分子が生成できる。そして、生成モデルはタンパク質と分子の3D相互作用を予測し、最適な薬の候補の発見を加速する、と続けた。
既に多くのグローバル企業が「BioNeMo」の導入を始めているという。
●アーリーアクセスを提供中
「NeMoジェネレーティブ AIクラウドサービス」はアーリーアクセスを提供中。Picassoサービスはプライベートプレビューを提供している。開発者はそれぞれのリンクより、アクセスを申し込むことができる。また、詳細の動画はフアン氏の基調講演の中で確認することができる。
GTC 2023 関連記事:
【NVIDIA Jetson Orin Nanoレビュー(1)】予約販売開始!新時代のAIエッジデバイスを最速で「開封の儀」 NVIDIAと三井物産 日本の創薬を変革するスーパーコンピュータ「Tokyo-1」を発表!製薬会社のジェネレーティブAI等の開発環境を加速 AI大型イベント「GTC 2023」開催迫る!注目のJetsonデベロッパーデイとDLIワークショップの見どころ「ChatGPT」など自然言語処理/基礎コースも AIとGPUの世界最大級のイベント「GTC23」3/21から開催 「Japan AI Day」も併催 注目の日本語字幕付きセミナーは?GTC 2022 関連記事:
ドイツ鉄道がデジタルツイン導入に着手 5,700駅と33,000km路線の鉄道網をNVIDIA Omniverseで構築 次世代の鉄道システム構築へ ドイツ鉄道がデジタルツイン導入に着手 5,700駅と33,000km路線の鉄道網をNVIDIA Omniverseで構築 次世代の鉄道システム構築へ ホームセンターのLowe’s、NVIDIAやMagic Leapと共同でインタラクティブな店舗のデジタル ツインを構築 小売業のOmniverse活用事例 NVIDIA「Jetson Orin Nano」のベンチマーク結果を公開 従来NanoやTX2 NXとの性能差は?「GTC 2022」レポート NVIDIA 自律走行搬送ロボット(AMR)リファレンス プラットフォーム「Nova Orin」のアップデートを発表 Nova Orin詳細を解説 こんなに多くの有名企業が既にデジタルツインに取り組んでいるとは…「GTC 2022」でNVIDIAがOmniverse採用企業を一挙に紹介 【速報】手術支援ロボットにNVIDIA「IGX AI」と「Clara Holoscan」を採用 開発ベンチャー3社が医療用AI開発を加速 【速報】NVIDIA「Isaac」AIロボット開発プラットフォームがクラウドサービスに対応 AWS RoboMakerも利用可能に 【速報】NVIDIA「Jetson Orin Nano」を発表 従来Nanoの約80倍の高性能 超小型AIコンピュータ Orinファミリーは3機種に いよいよ今夜24時、世界最大級のAIイベント「NVIDIA GTC」ジェンスン フアン氏のキーノート配信 新しいAIと未来 NVIDIA関連記事