ヘッドウォータースが「NVIDIA NIM ACE」で対話型AIデジタルヒューマンサービスを開始 生成AIやRAGも導入
ヘッドウォータースは、NVIDIA NIM ACEマイクロサービスを活用した対話型AIサービスを開始したことを発表した。
●デジタルヒューマンUI×マルチモーダルAIで実現すること
デジタルヒューマンにおける開発では、外観のリアリティやユーザーの意図を汲むインタラクション能力が求められ、3DCGモデルの制作だけでなく、人間の精細な感情の表現も重要なため、最先端のテクノロジーを取り入れた、人間のような表現を実現することが重要である。特に、顔や体を高精細に表現するCG技術、発話映像と音声を同期するリップシンク技術、そしてパーソナライズする上で膨大なパターンのコンテンツ生成が必要とされている。
NVIDIA NeMo、NVIDIA NIMおよびNVIDIA NIM Agent Blueprintsを含むNVIDIAのAIプラットフォームはデジタルヒューマンのアバターやより自然な音声の作成において開発者をサポートする。
さらに、リアルなデジタルヒューマンとの対話はマルチモーダルAIにより拡張。ヘッドウォータースでは、今までロボティクス×AIを活用した音声対話型のロボティクスやIoT、ヒューマンインタラクションUXのナレッジを長年蓄積しており、近年も音声対話×生成AIを活用したソリューションの提供を行っている。
そこにデジタルヒューマンUIと視覚情報は画像認識、聴覚情報は音声認識を組み合わせ、バックエンドにマルチモーダルAIを配備することで、カメラ映像や音声による話しかけで対話内容を自動的に変化させ、あたかも人間と話しているUXの提供を可能としている。
また、NVIDIA NIMマイクロサービスを扱う事により、顧客の要望に合わせてLLM、VLM、SLM、Retrieval、Speech、Visual DesignとNVIDIAが構築したモデルを即座にデプロイ可能にする。
プロンプトエンジニアリング、ファインチューニング、RAG(外部検索拡張)に加えクラウドロボティクスで対話内容の制御を行うことで、生成AIを活用した、企業独自の業務活用シナリオに沿った対話フローもカスタムすることができるため、、デジタルサイネージやスマートデバイス上で「バーチャル店員」「バーチャル案内係」と対話することができ、時間のかかる手作業の負担が軽減されてヒトはより価値の高い他の業務に集中できるようになるとしている。
ヘッドウォータースは現在、NVIDIA Partner NetworkのNVIDIA Omniverse Competency Solution ProviderおよびVisualization Competency Solution Providerとして活動。
ヘッドウォータースはNVIDIAとの連携を強化・拡大し、NVIDIA Omniverseプラットフォームを利用したデジタルヒューマンテクノロジー、Cloud XRやデジタルツインならびに車載などのエッジLLMを推進するため、AIを活用した新たなイノベーションを創出していくことを目指すとしている。
●今後の展望
今後は、NVIDIA NeMo、NVIDIA RTXを活用し、NVIDIAの小規模言語モデルであるNemotron-4を使用したファインチューニングやRAGサービスを提供する。
対話型サービスのデジタルヒューマン技術とマイクロサービスをNVIDIA ACEで強化し続け、特にデジタルヒューマンNVIDIA NIM Agent Blueprintのリリースは、AIアプリケーション開発を加速するための事前学習とカスタマイズ可能な多くのリファレンスAIワークフローの1つである。
また、SyncLectとの連携を強化・拡大していくとともに、これまでヘッドウォータースが蓄積し続けたMicrosoft Azureや Unreal Engine Metahumanのナレッジをかけ合わせる事でデジタルヒューマンAIソリューションの提供を加速・拡張していく。
●ヘッドウォータース・NVIDIA両社コメント
●株式会社ヘッドウォータース 代表取締役 篠田庸介 氏
●デジタルヒューマンUI×マルチモーダルAIで実現すること
デジタルヒューマンにおける開発では、外観のリアリティやユーザーの意図を汲むインタラクション能力が求められ、3DCGモデルの制作だけでなく、人間の精細な感情の表現も重要なため、最先端のテクノロジーを取り入れた、人間のような表現を実現することが重要である。特に、顔や体を高精細に表現するCG技術、発話映像と音声を同期するリップシンク技術、そしてパーソナライズする上で膨大なパターンのコンテンツ生成が必要とされている。
NVIDIA NeMo、NVIDIA NIMおよびNVIDIA NIM Agent Blueprintsを含むNVIDIAのAIプラットフォームはデジタルヒューマンのアバターやより自然な音声の作成において開発者をサポートする。
さらに、リアルなデジタルヒューマンとの対話はマルチモーダルAIにより拡張。ヘッドウォータースでは、今までロボティクス×AIを活用した音声対話型のロボティクスやIoT、ヒューマンインタラクションUXのナレッジを長年蓄積しており、近年も音声対話×生成AIを活用したソリューションの提供を行っている。
そこにデジタルヒューマンUIと視覚情報は画像認識、聴覚情報は音声認識を組み合わせ、バックエンドにマルチモーダルAIを配備することで、カメラ映像や音声による話しかけで対話内容を自動的に変化させ、あたかも人間と話しているUXの提供を可能としている。
また、NVIDIA NIMマイクロサービスを扱う事により、顧客の要望に合わせてLLM、VLM、SLM、Retrieval、Speech、Visual DesignとNVIDIAが構築したモデルを即座にデプロイ可能にする。
プロンプトエンジニアリング、ファインチューニング、RAG(外部検索拡張)に加えクラウドロボティクスで対話内容の制御を行うことで、生成AIを活用した、企業独自の業務活用シナリオに沿った対話フローもカスタムすることができるため、、デジタルサイネージやスマートデバイス上で「バーチャル店員」「バーチャル案内係」と対話することができ、時間のかかる手作業の負担が軽減されてヒトはより価値の高い他の業務に集中できるようになるとしている。
ヘッドウォータースは現在、NVIDIA Partner NetworkのNVIDIA Omniverse Competency Solution ProviderおよびVisualization Competency Solution Providerとして活動。
ヘッドウォータースはNVIDIAとの連携を強化・拡大し、NVIDIA Omniverseプラットフォームを利用したデジタルヒューマンテクノロジー、Cloud XRやデジタルツインならびに車載などのエッジLLMを推進するため、AIを活用した新たなイノベーションを創出していくことを目指すとしている。
●今後の展望
今後は、NVIDIA NeMo、NVIDIA RTXを活用し、NVIDIAの小規模言語モデルであるNemotron-4を使用したファインチューニングやRAGサービスを提供する。
対話型サービスのデジタルヒューマン技術とマイクロサービスをNVIDIA ACEで強化し続け、特にデジタルヒューマンNVIDIA NIM Agent Blueprintのリリースは、AIアプリケーション開発を加速するための事前学習とカスタマイズ可能な多くのリファレンスAIワークフローの1つである。
また、SyncLectとの連携を強化・拡大していくとともに、これまでヘッドウォータースが蓄積し続けたMicrosoft Azureや Unreal Engine Metahumanのナレッジをかけ合わせる事でデジタルヒューマンAIソリューションの提供を加速・拡張していく。
●ヘッドウォータース・NVIDIA両社コメント
●株式会社ヘッドウォータース 代表取締役 篠田庸介 氏
交通機関や小売現場などで労働力不足やAIの活用が求められる中、ヘッドウォータースが提供する「対話型AIデジタルヒューマンサービス」においてはNVIDIA AI と NVIDIA Omniverseの活用が不可欠です。
NPNとして、NVIDIA社との連携をさらに深め、社会のDXを推進すべく革新的なソリューション開発を推進いたします。
●エヌビディア合同会社 パートナー事業部 事業部長 岩永秀紀 氏
人間の労働者を支援するタスクを実行できるデジタルヒューマン機能によって、産業は変革されるでしょう。ヘッドウォータース様が提供されている広範囲な AI を活用したソリューションに、NVIDIAのデジタルヒューマンNIM Agent Blueprintを組み合わせることで、日本における様々な産業のデジタル化を強力に推進します。