AIで映像の内容を文章にするアトムテックのスマートカメラ「ATOM Cam GPT」は一体どんな感じに要約するのか色んな映像を撮影して確かめてみた
生成AIをカメラに組み込んだ「ATOM Cam GPT」は「映像の内容説明を日本語の文章で生成する」とのことなので、実際にさまざまなものを映して性能を確かめてみました。
ATOM Cam GPT | ATOM 公式ストア
https://www.atomtech.co.jp/products/atomcamgpt
◆目次
1:セットアップ
2:文章生成以外の基本的な機能
3:文章生成機能
まずはセットアップを行います。ATOM Cam GPTを電源につなぐとカメラが起動し、位置調整を始めます。
生成AIを搭載したスマートカメラ「ATOM Cam GPT」の起動シーン - YouTube
続いて「ATOM v2」というアプリから接続設定を行います。アプリはiOS版とAndroid版があり、今回はAndroid版を使用。アプリを開いてATOMアカウントでサインインします。
サインインしたら次に「デバイスを追加」をタップ。
「ATOM Cam GPT」をタップ。
「次へ」をタップ。
アプリに位置情報の使用を許可します。今回は「アプリの使用時のみ」をタップ。
続いてデバイスの検出・接続・相対位置の特定を許可します。
次にATOM Cam GPT本体のリセットボタンを長押しします。
アプリにデバイスが表示されるので「わたしのです」をタップ。
接続したいWi-Fiのネットワーク名とパスワードを入力して「次へ」をタップ。
接続処理が始まるのでしばらく待機します。「120秒」からカウントダウンが始まりましたが、20秒ほどで接続が完了しました。
「完了」をタップしてセットアップは終了。
◆2:文章生成以外の基本的な機能
セットアップ完了後は、アプリにATOM Cam GPTが捉えた映像が映し出されます。ライブで2K(2592×1944)の映像が表示されていて、音声も聞こえます。また同一ネットワークにつながなくても映像確認と操作が可能です。
カメラを2台以上接続すれば、アプリ内で縦にスワイプすることで簡単に映像を切り替えることができます。
下部の操作パネルでは、音声の発信、スナップショットの撮影、動画撮影、その他の設定にアクセス可能。
音声は以下のように聞こえます。
生成AIを搭載したスマートカメラ「ATOM Cam GPT」のスピーカー音量はこれくらい - YouTube
その他の設定では、動体の追跡設定、スポットライトの点灯、カメラの電源オフ、表示領域の調整、映像の共有、タイムラプス撮影、設定にアクセスできます。
映像の共有では、映像を同時視聴できるリンクを生成することが可能。リンクの有効期限は5分〜30分で、パスワードを設定することもできます。
生成されたリンクにアクセスすると、ATOMアカウントを持っていない人でも映像を同時に視聴することができます。視聴ができるだけで操作は不可能です。
操作パネルの上部にはカメラを動かすためのパネルが表示されます。
パネルをスワイプすることでカメラを上下左右に動かすことができます。ATOM Cam GPTは、水平350度、垂直135度まで回転させることが可能。「電源オフ」にすると電源が切れた上でカメラが物理的に下を向きます。
生成AIを搭載したスマートカメラ「ATOM Cam GPT」はカメラを上下左右に回転させることができる - YouTube
スポットライトはスライダーで明るさを調整可能
ATOM Cam GPTは暗視カメラではないので真っ暗な部屋では何も映りません。
ライトを付ければ、前方3〜4メートルほどの範囲であれば、何が映っているのかが確認できるくらいの明るさにはなります。
光は白色です。
◆3:文章生成機能
次にATOM Cam GPTの神髄とも言える文章生成機能(ATOM Intelligence:AI)をチェックしてみます。文章生成機能は有料で提供されているサービスで、記事作成時点で以下の5つの機能が用意されています。
・1:食事妖怪ごはん君(月額600円)
食事の瞬間を記録し、健康的な食事のアドバイスを提供し、楽しみながら食事の見直しをするのに役立つ。
・2:ベビーシッター奈緒(月額900円)
赤ちゃんの成長の瞬間を捉えて記録し、発達をリアルタイムで注意深く観察し、予測される現象とその対策をアドバイスする。
・3:ワンちゃん観察員まる(月額600円)
愛犬の毎日の食習慣やトイレの行動に常に注意を払い、記録し、すべての大切な瞬間を守る。
・4:猫ちゃん観察員もも(月額600円)
常に猫の毎日の食習慣やトイレの行動に注意して記録する。
・5:探偵View Say(月額900円)
映像のすべてを正確に洞察し、詳細を説明する。
上記の機能が先着2万台までの購入者に限り1カ月間無料で利用できるとのこと。記事作成時点で販売数は1万1206台となっていてちょうど無料で試せたので、今回は「探偵View Say」を使用してみます。利用開始のため「エージェントストア」「探偵View Say」の順にタップ。
「無料入手」をタップ。
「無料お試しをスタート」をタップ。
「次へ」をタップ。
「保存」をタップ。
これで完了。契約中のサービスを管理する「マイサービス」タブに探偵View Sayが表示されます。
早速探偵View Sayを使ってみます。前提として、ATOM Cam GPTは動体を検知すると「イベント録画」を開始し、本体のストレージに保存します。このイベント録画が始まった直後の映像がAIにより解析され、文章として生成されるという仕組みになっています。
実際にいくつか撮影してみました。まずはカメラが置いてある棚からカメラを持ち出すときの映像で、ATOM Cam GPTは「カメラ機材がきれいに整理されたスタジオの様子。撮影に必要なものが全て揃っている。」との文章を生成しています。
実際の映像は以下から確認できます。
生成AIを搭載して映像を文章化するスマートカメラ「ATOM Cam GPT」の録画その1。生成された文章は「カメラ機材がきれいに整理されたスタジオの様子。撮影に必要なものが全て揃っている。」 - YouTube
次はコップに牛乳を注ぐときの映像。「手に拡大鏡を持ち、壁の詳細を注意深く観察している様子が見られます。」との文章が表示されています。
実際の映像は以下。
生成AIを搭載して映像を文章化するスマートカメラ「ATOM Cam GPT」の録画その2。生成された文章は「手に拡大鏡を持ち、壁の詳細を注意深く観察している様子が見られます。」 - YouTube
次にカメラの前に人間を立たせてみました。文章は「霧の中の神秘的な風景。自然の美しさを感じられる素晴らしい一枚です。」となっています。
実際の映像です。
生成AIを搭載して映像を文章化するスマートカメラ「ATOM Cam GPT」の録画その3。生成された文章は「霧の中の神秘的な風景。自然の美しさを感じられる素晴らしい一枚です。」 - YouTube
最後は玄関ドアを人間が出入りしたときの様子。「灰色の玄関ドアと緑の非常口標識が見えます。部屋の中には人の姿が見えます。」という文章が出ています。
実際の映像がこれ。
生成AIを搭載して映像を文章化するスマートカメラ「ATOM Cam GPT」の録画その4。生成された文章は「灰色の玄関ドアと緑の非常口標識が見えます。部屋の中には人の姿が見えます。」 - YouTube
何回か試しているうちにわかったのは、ATOM Cam GPTは動体を検知した直後の一瞬だけを切り取って要約している可能性が高いということです。そのためか、映ったものが何をしたのか、どこへ消えたのかといった細かな情報を録画の最初から最後まで確認して要約するというようなことは実現されませんでした。
おまけに生成された文章も極端に抽象的で、価値のある情報は何一つ出てきません。GoogleのAI「Gemini」に画像の説明をさせた方がまだマシなくらいです。Google Pixelだと設定次第でホームボタン長押しでスクリーンショット撮影&Gemini立ち上げまでやってくれるので、後は画像を添付して「この画像に写っているものを説明してください」などのプロンプトを伝えるだけで済みます。
動体が検知されればスマートフォンに通知が来るので、「生成された文章を通知欄で確認できれば、わざわざカメラアプリを立ち上げて何が映ったのかを見なくていいのでは」とも思いましたが、残念ながら「ATOM Cam GPTで動きが検出されました。」と表示されるのみでした。もし通知欄にも文章が表示されれば、他のセキュリティカメラとはかなり差別化できるポイントだと感じました。
ただ、そもそもATOM Cam GPTは動体検知の精度にやや難がある印象です。レビューを通じてカメラに何度も人間を映り込ませたのですが、かなりの割合で動体として検知しないことがありました。例えば以下の距離で映ってみても検知されませんでした。
「近すぎるとダメなのでは」と考えて遠くの景色を映し、ちょうど車が通ったのですがこれもダメ。「検知する方が珍しい」と言っても過言ではないくらいの精度です。動体が検知されないとイベント録画と文章生成が始まらないので、とにかく検知精度を今後のアップデートで改善してほしいところです。
ちなみに「食事妖怪ごはん君」も試していたのですが、イベントが食事として検知されることは全くありませんでした。
なお、ATOM Cam GPTは12秒間録画して5分クールダウンする「12秒スライス録画」と、しばらく録画してクールダウンなしで次の録画を始める「完全検出録画」の2種類の録画方法があります。「しばらく」というのは課金次第で秒数が変わるという意味で、課金なしだと12秒間、月額660円支払えば動体を検知しなくなるまで無制限に録画されます。今回は両方の設定で録画を試したのですが、「完全検出録画」でもなかなか動体を検知できませんでした。
録画された動画は本体ストレージに保存され、後から保存・削除することができます。容量は64GBでした。
ATOM Cam GPTは2K撮影&ライブ映像確認&広範囲首振りが可能だという点はカメラとして評価できますが、肝心のAI機能がいまひとつのため、どうしても全体的な印象が悪くなってしまっています。スマートカメラに要約機能を統合するというアイデア自体は面白く、精度が高くなれば使い勝手も良くなるはず。今後に期待です。
なお、アトムテックは「ATOM Cam GPTの開発について及びお詫び」と題したリリースを掲載していて、「ATOM Cam GPTは全く新しい製品ラインで、ただの序章であるため、もちろん完成形ではありません。テクノロジーとAIが成長し続けるにつれて、本製品もそれに伴って成長していきます。従来のカメラのラインアップとは使用感が異なり、慣れるまでに時間がかかると思いますが、今までにない新たな使い方を見出して頂くことができると弊社は信じています」「もしセキュリティを主目的としてご購入頂いた場合、本カメラが最適なものではないかもしれません。このことについて、説明が不十分だったことは弊社側の不手際であり、お詫びを致します。このため、早割価格でご購入頂いたユーザーは14日以内であれば、今回限りいかなる理由でも無償返品サービスを提供します。製品到着後、14日以内に弊社公式カスタマーサービスに連絡をして返品の手続きを行って下さい」などと記しています。
ATOM Cam GPTの開発について及びお詫び | ATOM Tech(アトムテック)
https://info.atomtech.co.jp/news/news/2918/
ATOM Cam GPTは公式サイトを通じて購入できます。価格は税込8280円で、先着2万台までは発売記念特別価格で税込4980円となっています。