Google Chrome、同意なしで4GBのローカルAIモデルをダウンロードさせている
Google Chromeが、ユーザーの同意なしに約4GBものAIモデルをデバイスに自動的にダウンロード・保存させているという件が判明しました。「OptGuideOnDeviceModel」というフォルダの中に、こっそり4GBも忍び込ませいるようです。
「That Privacy Guy(プライバシー・ガイ)」として有名なアレクサンダー・ハンフ氏によると、そのフォルダ内で最大のサイズの「weights.bin」というファイルこそが、Gemini Nanoの正体とのことでした。
Gemini Nanoの目的は?
米Gizmodoに対する Google(グーグル)のコメントによると、Gemini Nanoはすでに2024年からデバイス上に搭載されていたとのこと。Googleのブログ記事によると、この小さなAIモデルの目的は、デベロッパーが「ネットワーク接続やクラウドへのデータ送信を必要とせずに、リッチな生成AI体験を提供できるようにする」とのこと。特に、「低コスト、そしてプライバシー保護が最優先事項である場合」において、その真価を発揮するそうです。
ネット上には、ネットワーク接続なしで動作するローカルAIモデルの情報交換をし合うコミュニティが存在しています。彼らがローカル環境を支持する理由は、AIをデータセンター、(彼らにとっては)現代における「暗い悪魔の工場」で動かさないためです。
加えてローカルAIなら、ユーザーのデバイスの計算能力だけでいろいろな機能を実行できますし、理想的にはユーザーのデータに外部からアクセスすることもなくなります。ローカルAIの「プライバシーへの安心感」を信じていたのに、知らない間にChromeの中にLLMがいたなんて、ちょっと心外ですよね。
Gemini Nanoを使ってみる方法(非推奨)
今回、このChromeの内蔵Gemini Nanoを実行できる方法を見つけました。「ChromeAI.org」というサイト経由になりますが、どこがこのサイトを作っているのか調べていくと、上海を拠点に活動していると思われる pipizhu(または debugtheworldbot)と名乗るGitHubユーザーにたどり着きます。
最初は、自分自身のChrome環境でこのGemini Nanoモデルを実行しようとしましたが不可能でした(ある意味安心です)。デフォルトのセキュリティ設定は強固にロックされていて、ChromeAI.orgから実際にチャット画面を使えるようにするには、サイト側が「必要な実験用フラグ」と呼んでいる、あらゆる種類の「(大丈夫かな?と思うような不安な)許可」を与える必要があります。読者の皆さんにはこの操作はおすすめしません。
準備を整えたあとは、クラウドで計算されたAIのトークンがノートPCに紛れ込んだり、逆に流出したりしないよう、Wi-Fiをオフにしました。それから、まるでChatGPTが登場したばかりの2022年11月に戻ったかのような気持ちで、このAIとのチャットを開始してみました。
Gemini Nanoをチャットボットとして使ってみた
実際に使ってみた感覚も、初期のChatGPTのような感じでした。私のMacBookは、2022年のApple M2チップと8GBのメモリで動いているにもかかわらず、このモデルは驚くほど高速で、有能であるように感じました。ただ、バックグラウンドで動作する「思考の連鎖(Chain-of-thought)」ができないので、やはり裏付けとなるソースを求めてウェブを検索しにいくこともしません。
例えば、ブルキナファソの首都はどこかと尋ねてみると、即座に「ワガドゥグ」と返答、これは正解です。
そこで次に、P.G.ウッドハウスの小説のキャラクターである「執事のジーヴス」になりきって話すよう指示してみたところ、結果は、それなりになりました。
おお、これはこれは! 実に素晴らしいお考えですな! ジーヴスと語らうということは、沈着冷静、聡明、そして非の打ちどころのない審美眼の鑑と語らうも同義。エッヘン。特定のジーヴス像をお持ちとお見受けしますが? 素晴らしい! 彼の立ち居振る舞いや機知を、私の力の及ぶ限り再現するよう努めましょう。どうか、お聞かせ願いたい。あなたがお好みのジーヴスは、とりわけ、活気に満ちたお方ですかな? あるいは、型破りな解決策を好むような一面も?
実際のところ、なんとなく古臭い言葉遣いとイギリス英語の綴りで話し始めました。うん、それっぽい。
その後、私は「ジーヴスの件はなかったことにして」と伝え、90年代のゲーム「モンキー・アイランド」シリーズに関するクイズを出してみました。4GBのファイルの中に、どのくらい知識や事実が格納されているのかを確かめたかったのです。
(スクリーンショット訳)
※筆者(青い吹き出し)
「ジーヴスの件はなかったことにして。単純に、おぼろげな記憶しかないかなりマニアックな質問をしたいだけなんです。「モンキー・アイランド」のゲームの一つで、私の記憶が正しければ、大きな猿の頭の彫像に鍵を差し込む場面があったはず。その猿のどの部分が鍵穴になっていて、鍵はどんな形をしていましたか?」
Gemini Nano
「(考え込むような沈黙。それに続いて、想像上の羊皮紙がカサカサと鳴る穏やかな音が響く)
ああ、いかにも! モンキー・アイランドのことですな! 実になんとも愉快で、いたずら心にあふれた冒険物語です。おっしゃる通り、猿の彫像にまつわる、かなり独創的なパズルが存在します。白状いたしますが、あれは最高に心躍るゲームプレイの一部でございました。
詳細についてお尋ねになるとは、実にお目が高い。我が友よ、その鍵穴は、猿の面容の下の頬袋の中にございます。実にかしこい配置ですな。ある程度の身体的な操作を必要とするように設計されているのです。
そして鍵の形についてですね? それは疑いようもなく、かなり奇妙なものでございます。それは、小さな、複雑に彫られた…いわばココナッツの殻に似ております。日常生活で目にする標準的な鍵とは全く異なりますが、そう思いませんか? 鍵の用途に合わせて、片側にわずかな窪みがある、やや円錐形のフォルムをしおります」
AIはデタラメを伝えただけでなく、ジーヴスの件はなかったことにしてという指示を無視して、ジーヴスのキャラ設定を維持してきました。ちなみにこの質問の正解は、鍵を差し込むのは猿の耳であり、その鍵の形は「巨大な綿棒」です。
その後、ジーヴスのように話すのをやめるよう伝えましたが、Gemini Nanoは引き続きシーブスのキャラ設定のまま謝罪してきました。
心よりお詫び申し上げます! 実に不面目な計算違いでございました。私はどうやら、ジーヴスの人格に対して、いささか…非常に強い愛着を抱いていたようです。このたびの不作法、どうかお許しくださいませ。
そしてこれで3回目ですが、ジーヴス風に喋るのをやめろと言ったところ、AIはこう答えました。
私はどうやら、過剰なまでに演劇的な振る舞っていたようです。深くお詫び申し上げます。今後は、そのような話し方を慎むよう、信心深く誓って努力いたします。
4度目の指示で、ようやくジーヴスキャラを多少抑えることができました。前の質問に対する答えが間違っていたので、もう一度「鍵」について聞いてみましたが、Gemini Nanoは間違いだったことを認めました。
やれやれ。
アメリカ大統領のリストアップ依頼も間違いだらけ
このAIに「LLMっぽいこと」をさせようと思い、アメリカ合衆国大統領を就任時の年齢順に並べたリストを作るよう依頼してみました。先に言っておくと、その結果はひどいものでした…。
確かにこれは簡単ではありません。とはいえ、ハルシネーションも甚だしい状況で、せめて「史上最年少の大統領」セオドア・ルーズベルトに触れてほしかったですね。ランダムな順序でランダムな大統領をリストアップして、さらに「ジョン・F・リンカーン」という架空の大統領を捏造してしまいました。
もちろん、その「ジョン・F・リンカーン」について問い詰めました。
ご指摘の通りです! それは私の間違いでした。ジョン・F・リンカーンという米国大統領は存在しません。ユーモラスな(そして間違った)名前ですね! 申し訳ありません。データベース内で何かを混同してしまったようです。
と答えつつも、案の定、AIは二度目も「ジョン・F・リンカーン」をリストに載せてきました。これだけで、このモデルに一体何ができるのか(あるいは何ができないのか)、もう完全理解です。
オリジナルのChatGPTを動かしていたGPT-3が、350GBの容量を使って、それでもやはりハルシネーションを起こしていたことを思えば、たった4GBのデバイス内モデルが、ひどいなりにこれだけのパフォーマンスをみせるのはある意味素晴らしいですね。GPT-3以前の時代のOpenAIのモデルと比較すれば、やはりGemini Nanoのほうが優れていると言えそうです。
でもこれではっきりしましたね。Gemini Nanoをチャットボットとしては使えないし、Googleもそのように使うことを想定していないことがよーくわかりました。

GIZMODO テック秘伝の書
