ローカルで動作するスマホ向けAI「Gemini Nano」を開発者が自分のアプリに組み込めるように
GoogleのAI「Gemini」ファミリーのスマートフォン向けモデル「Gemini Nano」について、開発者がアプリに組み込むことが可能になったと発表されました。これにより、各アプリでユーザーデータを外部に送信することなくローカルでAIを利用できるようになります。
Android Developers Blog: Gemini Nano is now available on Android via experimental access
Android Developers Blog: An introduction to privacy and safety for Gemini Nano
https://android-developers.googleblog.com/2024/10/introduction-to-privacy-and-safety-gemini-nano.html
2024年10月1日よりGemini Nanoへの実験的アクセスが開放され、AI開発用キットの「AI Edge SDK」を持つすべてのAndroid開発者がGemini Nanoを利用できるようになりました。最初はPixel 9シリーズでテキスト入力によるプロンプトの実験を行うことが可能とのことです。
こうした処理はサーバーを呼び出すことなくデバイス上で直接行われるため、機密性の高いユーザーデータをデバイス内のみで取り扱えること、インターネット接続なしでフル機能を利用できること、推論ごとに追加費用が発生しないことなど、多くの利点があります。
Googleによると、Gemini Nanoのようなオンデバイス生成AIモデルはクラウドサーバーよりも少ない計算能力で実行されるため、チャットボットのような「何でも屋」ではなく、要求が明確なタスクをうまく処理できるとのこと。例えば特定のテキストを別の言葉に言い換えてカジュアルな言葉遣いにしたり、メッセージに対する応答を生成したり、文章を構成・要約したりするといったユースケースがこれに当たります。
Gemini Nanoは、Googleが開発するPixel向けスクリーンショット機能や画面読み上げ機能、レコーダーアプリなどへ既に組み込まれていて、マルチモーダル機能を利用した画像理解や音声理解などに役立っているそうです。
Googleは「生成AIモデルをモバイルアプリに直接統合することは多大な計算リソースとストレージ容量を必要とするため困難です。この課題に対処するために、私たちはAndroidの新しいシステムサービスであるAICoreを開発しました。AICoreにより、ランタイム、モデル、その他のコンポーネントを自分で配布することなく、デバイス上で直接実行されるAIの恩恵を受けることができます」と述べました。
Googleによると、AICoreはデータをプライベートに保つPrivate Compute Core(PCC)という環境に準拠しており、PCC準拠の限られたシステム・パッケージとしか相互作用できず、インターネットに直接アクセスすることはできないようになっているとのことです。これにより、アプリ内で外部と通信することなくAIを利用できることのほかに、データが他のアプリに公開されるリスクを軽減し、入力データや出力の記録が一切保存されないという点が明確になっているそうです。
◆フォーラム開設中
本記事に関連するフォーラムをGIGAZINE公式Discordサーバーに設置しました。誰でも自由に書き込めるので、どしどしコメントしてください!Discordアカウントを持っていない場合は、アカウント作成手順解説記事を参考にアカウントを作成してみてください!
• Discord | "「Gemini Nano」を活用してどんなアプリを作れそう?" | GIGAZINE(ギガジン)
https://discord.com/channels/1037961069903216680/1290995796686147656