AIアシスタント、Siriが大幅にパワーアップする予定のiPhone。呼び出したときのエフェクトも画面の縁が虹色に光るなど派手になったが、それには理由が存在する(写真:アップル)

6月10日のWWDC24で、Apple IntelligenceというAI機能の搭載を発表したアップル。その特徴はさまざまだが、今回は”魔法のような”実装にこだわる理由を解説したい。

過去にも、Mac用のインターフェイス系デバイスの製品名の頭文字にMagicを付けたり、ウェブサイトの商品紹介キャッチコピーでも「魔法のような」という言葉を多用してきた。アップルの言う「魔法」とは何なのか?

iPhoneが使いやすいと感じる理由

なんとなく「iPhoneは使いやすい」と感じている人は多いと思う。そう思うのには、きちんとした理由がある。

アップルは昔から「どうすればユーザーが使いやすいか?」を定めるドキュメントをアプリ開発者に提供し続けている。そのドキュメント、「Human Interface Guidelines」は、50年もの長きにわたりアップデートされ続けている。


Macより以前の製品、Apple IIのHuman Interface Guidelines(写真:アップル)

開発者向けとはいえ、一般にも公開されており、誰でも見ることができる。アップルが、いかに優れた使い勝手を実現するために努力しているかがよくわかる。アップルにとってデザインとは見た目の美しさのことではなく、洗練された使い勝手を意味するのだ。

例えば、ほかの人にiPhoneの使い方を教えるために、逆さまの向きでiPhoneを持った際、アイコンなどをタップしにくいと感じたことはないだろうか?

実は、iPhoneのディスプレーにグラフィックとして表示されるアイコンの位置と、実際タッチパネルとして反応する位置は若干異なっている。

具体的には、表示位置より“少し下”が反応するようになっているのだ。iPhoneを手に持って自然な位置で操作した際、快適と感じる反応位置を最適化している。よって、逆さに持って操作すると、いつもと違う反応になるわけだ。

また、英文字を入力するときのキーボードは、ダイナミックに反応位置が変化している。


「Guideline」とタイプする際、Guidelinまでタイプするとeの反応領域が(見た目は変わらないが)大きく広って、ミスタイプしにくくなっている(写真:アップル提供)

英文をタイプする際、一般的な文章であれば、EやAなど母音の出現率のほうが高い。また、ある文字を入力したあとに特定の文字が来る可能性も変化する。

例えば、Qという文字の次には、かなりの確率でUが来る。Bの次はEである可能性が高く、Tである可能性はかなり低い。iPhoneの英文字キーボードの反応領域は、次に来る文字の確率に応じて、サイズが瞬時に変わる仕組みになっている。「Guidelin」とタイプすると、eのキーが反応する領域は、最大限にまで広がる。

そのような目には見えない最適化の数々で、iPhoneのキーボードは入力しやすくなっているのだ。


現在のHuman Interface Guideline。どのような要素を、どのように配置するか、緻密に定められている(写真:アップル)

魔法をApple Intelligenceへ

普段われわれが使っているiPhoneや、Macのインターフェースにもさまざまな“魔法のタネ”が仕込まれている。

マジシャンは前口上を述べ、あなたの目の前で「パチン!」と指を鳴らしてみせる。タネを見破ろうとしているあなたは、当然その指の音に注目してしまう。その間に、マジシャンの左手の袖口にスルリとタネであるコインが仕込まれる。

アップルの魔法も原理的には同じだ。例えば画像をクリックして、低解像度の画像が段階的に開いていくアニメーションを見ている裏で、高解像度の画像が準備されている。

もちろん、アニメーションにはどのアイコンの画像が開いたのかを示す役割もある。しかし、同時にユーザーの注意を引いて、待ち時間を感じさせず、処理速度の足りない部分をカバーする役割も担っているのだ。

iPhoneやMacを注意深く観察すると、これらのトランジション(遷移)効果があらゆるところに使われていることに気が付くはずだ。アップルのユーザーインターフェースのガイドラインには「これらの効果を使ってユーザーを退屈させず、魔法のような効果を与えましょう」と、はっきりと書いてあるのだ。


6月上旬に開催されたWWDC24で発表されたApple Intelligenceにも、アップルの魔法がふんだんに使われている(写真:アップル)

新しいApple Intelligenceでは、生成AIの動作により時間がかかるので、この魔法の効果はより効果を増している。

Siriを呼び出すとiPhoneの画面のフチから内側に向け、虹色の光が脈立つ。この虹色の光は魔法のような雰囲気を与えるとともに、実際にユーザーの注意を惹いて、ユーザーに待っているという意識を与えずに処理時間を稼ぐのである。

例えば、Apple Intelligenceに文章を要約してもらうとしよう。

iPhoneの画面の縁は虹色に輝き、文章が表示される部分に虹色のバーが現れる。ユーザーは「ここに文章が現れるのだ」と気付き、そこに注目する。すると、虹が波打つような効果とともに文章が生成される。


生成AIが文章を考える間、虹色に輝くバーが現れ、マジカルなトランジションとともに文章が生成されていく(写真:アップル提供)

アップルの端末に搭載されたチップの処理速度がいかに速いとはいえ、生成AIには処理するための時間が必要だ。この派手な虹色の効果は、その待ち時間を感じさせないために使われているのだ。

生成AIで画像を作る機能においては、さらに長い待ち時間のために、虹色の玉が脈打ち、さまざまなワードが周囲から浮かび上がり(通常の生成AIでは「プロンプト」と呼ばれる、殺風景な画像)、虹色の玉の周りをフワフワと漂って、最終的に膨れ上がった虹色のフレームの中に絵柄が生成される。


手書きのラフをImage Wandで囲むと、虹色の光に包まれ、周囲のテキスト原稿からページの文脈を判断し、単語を抽出。その単語をプロンプトにした画像を生成する(写真:アップル)

数多くの写真や動画から、家族を感動させる素晴らしいムービーを作るMemory Movieの場合は、生成にさらに時間を要し、数多くの写真が立体的なタイルのように集まり、脈動し、虹色の光に包まれる大仰なトランジションが流れる。

しかし、これはこけおどしではなく、これから作られるムービーに入る(かもしれない)写真や動画がちゃんと含まれており、プロンプトに相当する文字群も含まれており、実に芸が細かい。


Apple Intelligenceを使ったMemory Movieの演出は壮大だ。家族写真とオーダーした文脈にしたがって写真が明滅し、虹色に脈動するなど、見ていて飽きない(写真:アップル)

これこそが、「アップルの魔法」だ。誤魔化しではなく、ユーザー主体の使い勝手を追求した結果と言える。

食事だけポンと目の前に放り投げられるようなディナーに、人々は大金を払わない。豪奢なレストラン空間があり、美しい所作を持つスタッフがサーブするからこそ、人々は高級レストランにお金を払うのである。

AIをApple Intelligenceと呼んだ理由


ChatGPTを使う際は「ここからはChatGPTを使うよ?(=この先、アップルの責任ではないよ!)」というメッセージが表示される(写真:アップル)

Apple Intelligenceには、もうひとつ注意深い“防御の魔法”もかかっている。

それは、AIに対する人々の反感を、アップルのほうへ引き寄せないようにするための魔法だ。

現在のAIは技術の進歩とともに、さまざまな問題も生んでいる。事実と異なる回答を出力するハルシネーションの問題もあれば、莫大な電力消費の問題、フェイク画像などの問題などだ。また、著作権侵害の懸念や、人の仕事を奪うという根強い反感もある。

Apple Intelligenceは、それらの問題に対して注意深い対策を講じている。電力消費の問題は、そもそもApple Siliconの低消費電力もあるし、オンデバイスで行う処理も多い。フェイク画像の問題については、そもそも写真と見間違うような画像を生成しない仕様になっている。

そもそも、AIを“Artifical Intelligence”ではなく、“Apple Intelligence”としたところに、AIに関する諸問題とアップルは関係ないですよという意思表示になっている。

ユーザー心理を巧みに読み、世論を巧みに読み、後出しジャンケンと言われながらも大きな問題を起こさず、キッチリ収益を得られる製品を完成させてくる戦略の深さこそ、アップルの最大の魔法なのかもしれない。

(村上 タクタ : 編集者・ライター)