グーグルは、Pixel 8(左)とPixel 8 Pro(右)を10月12日に発売する(筆者撮影)

グーグル自身が手がけるスマホの最新モデルとなる「Pixel 8/8 Pro」が、10月12日に発売される。グーグル直販の価格はPixel 8が11万2900円から、Pixel 8 Proが15万9900円から。ドコモ、KDDI、ソフトバンクの3キャリアも、この2機種を販売する。Pixel 8はよりボディがコンパクトになり、手にフィットする持ちやすさを実現。Pixel 8 Proは6.7インチの大画面はそのままに、フラットなディスプレーになり操作性がアップした。

AI処理の性能が大幅アップ

2機種とも、広角カメラの感度を上げるなど、カメラも進化している。特にPixel 8 Proは、画角が125.5度と広い超広角カメラが48メガピクセルに高画素化し、より明るい写真が撮れるようになった。Pixel 8 Proは、新たに温度センサーも内蔵している。ただし、こうしたハードウェアのアップデートはあくまで表面的なもの。Pixelの価値は、グーグルのAIが動くところにある。

同社は、「Pixel 6」に合わせてチップセットを自社設計に切り替えており、Pixel 8/8 Proでは最新の「Tensor(テンサー) G3」を採用。AIを処理する能力が2世代前の「Tensor G1」と比べて2倍に向上しており、その力を生かしたさまざまな新機能を搭載している。写真から写り込みをワンタップで消せる「消しゴムマジック」で注目を集めたPixelだが、それを進化させたようなものも。ここでは、そんなPixel 8/8 Proで使えるAIを生かした便利機能を紹介していく。

AIを生かした1つ目の目玉になるのが、消しゴムマジックを編集機能に拡大した「編集マジック」だ。消しゴムマジックは、写真に写り込んでしまった障害物や人をあたかも最初からいなかったかのように自動で消すことができる機能だが、編集マジックは、一歩踏み込んでユーザー自身で写真を加工できる機能。生成AIを活用し、編集で不足している部分を補っている。

AIをフル活用した、魔法のような編集機能

例えば、写真に写っている人物を移動させるといったことが可能。写真から人物を切り抜いても、当然ながらその背後は写っていないが、編集マジックでは、これを生成AIで書き足し、あたかも人だけが移動したかのように写真を加工できる。人物を指で指定し、ドラッグしていくだけでよく、難しい操作は不要。専門的な知識なしでも編集ができる。

また、空の色を変えて夕方のようにしたり、晴れた日のようにしたりといった編集も可能。写真に空が写っているかどうかもアプリ側が自動で判別し、選択肢が提示される。写真の背景をボカしてポートレートのようにするといったことも可能。AIをフル活用して、複雑だった編集をスマホだけで簡単にできるようにしているのが、編集マジックが“魔法(マジック)”と呼ばれるゆえんだ。


編集マジックでは、ワンタップで空を置き換えたり、人物を移動させたりといったことが可能。生成AIをフル活用している(筆者撮影)

編集マジックとは別機能だが、「ベストテイク」もおもしろい。こちらは、集合写真で利用できる機能。複数枚撮った集合写真を合成し、写った人の顔をすげ替えることでベストな1枚を作り出してしまうことができる。AIが人物の顔を検知し、1人ずつ顔の差し替えが可能。あたかも最初からその顔で写っていたかのような、背景にきちんとなじんだ形で合成される。

集合写真を撮るとわかるが、3、4人程度でも全員がバチっと目を見開いてくれないことは多い。まばたきのタイミングが合わず、1人だけ目をつぶった写真になってしまうことはままある。撮り直したら、今度は表情がイマイチといったように、ベストな1枚を撮るのはなかなか時間がかかる。ベストテイクは、この手間をAIで軽減する機能。こちらも、Pixel 8/8 Proであれば、簡単に使うことができる。AIや生成AIを使い、写真の編集をより身近にしたのがPixel 8/8 Proの売りの1つと言えるだろう。

グーグルは、消しゴムマジックを「音声」にも拡大した。それが、「音声消しゴムマジック」だ。こちらは、動画の編集機能。その名のとおり、動画の音声を最初からなかったかのように消すことができる。動画を撮影した際に車の走行音が入ってしまったり、子どもの泣き声が入ってしまったりといった場合に、これらを後から編集で消すことができる。

動画の音声編集もAIで簡単に

音声消しゴムマジックは、AIで動画内にどのような音声が流れているかを分析し、ユーザーに提示する。例えば、街角で楽器を演奏しているシーンで音声消しゴムマジックを使うと、「音楽」「周囲の人」「ノイズ」といった形で、編集したい音声の選択肢が現れる。ユーザーはその選択肢をタップし、音量をスライダーで調整するだけだ。

上記の場合、「周囲の人」をタップし、音量をゼロにすれば、楽器を演奏している人の周りで話していた人の声が消えてしまう。ざわざわとした周囲のノイズを消したいときには、「ノイズ」をタップして音量を調整すればいい。このような作業を手動でやるのは、かなり大変。これをスマホのタップとドラッグだけでサッと編集できるのは、インパクトが大きい。


音声消しゴムマジックは、動画に流れている音を自動で判定。その音ごとに、音量を調整できる(筆者撮影)

また、ゼロにするだけでなく、音量調整ができるのもポイント。例えば子どもがテーマパークで遊んでいるところを動画で撮ったとしよう。その際に、周囲の音が大きすぎて、何をしゃべってるかが聞き取りづらいこともある。このようなときには、音声消しゴムマジックの出番だが、周囲の音がゼロになってしまうと不自然さが残る。こうしたケースでは、音量を残しつつ、下げたほうがいい。消しゴムマジックの名を冠しているが、実際には単に音声を消すだけでなく、きめ細かな編集が可能だ。

ほかにも動画関連では、発売後のアップデートで画質を向上させる「動画ブースト」に対応する予定。その中の1つに、ビデオ夜景モードがある。これは、夜景などの低照度時のノイズを減らし、明るく、はっきりとした色味の動画を撮影できる機能。写真では一般的な「夜景モード」の動画版だ。もちろん、その画質調整にもAIが使われている。これまでは写真が中心だったPixelの画質向上機能だが、処理能力が上がり、動画にもその範囲が拡大してきたと言える。

AIの処理能力が向上、音声認識の精度も向上している。Pixelには、音声入力機能が組み込まれており、キーボードと音声の両方で切り替えの必要なく、シームレスな入力が可能になっている。例えば、住所を入力する際に、漢字部分はキーボードで打ち、数字とハイフンが入り交じる番地などは音声に任せるといったことが簡単にできる。Tensor G3の採用によって、この音声認識にも新機能が加わっている。

音声認識機能も大幅にパワーアップ

言語の自動判定が、その1つだ。これまでの音声入力では、日本語と英語などの言語を切り替える際に、キーボードの変更が必要だった。これに対し、Pixel 8/8 Proでは、そのまま端末に話しかけるだけで言語が認識され、対応する文字が入力される。日本人同士でやり取りしている場合、チャットやメール入力中に突然言語を変えるケースは少ないかもしれないが、外国人を含めてコミュニケーションを取っているようなときに便利な機能だ。

この言語の判定は、Pixelの売りの1つになっている文字起こし機能付きのレコーダーアプリにも搭載される。Pixel 7シリーズまでのレコーダーは、文字起こししたい言語をユーザーが選択する必要があった。そのため、別の言語が設定されていると、録音開始後、すぐに文字起こしが始まらなかった。対応している言語数はまだそこまで多くないが、急いで録音したいときに手間がかかっていた。


これまでのレコーダーは、画面のように言語設定が必要だった。Pixel 8/8 Proでは、これが自動認識になる(筆者撮影)

Pixel 8/8 Proでは、話している言語をAIが認識し、この設定を自動で切り替えてくれる。そのため、設定変更が間に合わず、話の冒頭だけ文字になっていないという失敗を防ぐことが可能になった。手動での設定変更が難しい言語混在環境では、特にありがたい機能と言えるだろう。

例えば、英語の講演に日本語の逐次通訳が入っていたとする。これまでのレコーダーだと、英語話者と通訳の言葉をそれぞれ文字にしようとすると、都度設定の変更が必要だった。かなりの手間がかかるため、このようなときには英語か日本語のどちらかにしたままの人が多いだろう。言語認識ができるようになれば、両方を設定変更の必要なく記録できる。

さらに、生成AIを使い、録音した音声を要約してくれる機能にも対応する予定だ。

Pixel 8/8 Proの新機能には、こうしたAIをフル活用したものが多い。デザインテイストを大きく変えていないため、ぱっと見での新鮮さは薄いかもしれないが、その真の価値はAIにあると言えそうだ。


この連載の一覧はこちら

(石野 純也 : ケータイジャーナリスト)