【ChatGPT】世界を根本的に変える?「GPT-4」5つの驚異的な可能性を解説
創業した会社でフルリモートワーク化を導入した経験を持ついけともが、リモートワーク時代に必要なツールやノウハウを発信するチャンネル「リモートワーク研究所【リモ研】」。今回の動画では、話題のAIチャットサービスChatGPTの最新モデル『GPT-4』のデモ動画を見ながら驚異な5つのポテンシャルを解説する。


この記事はYouTube配信「【知らないとヤバい】GPT4、驚異の5大ポテンシャル〜最速で3月15日のOpenAIのデモ動画を確認する」から、ライブドア社の自動書き起こしツールによって生成されています。

はじまり


こんにちは、リモートワーク研究所・いけともです。本日は『GPT-4 脅威の5つの可能性』と題してお伝えします。

今日・3月15日の日本時間だと午前ぐらいに、Open AIの共同創業者の方が『GPT-4』のデモ動画をあげていました。概要欄にもYouTubeのリンク貼ってありますけれども。これ、ライブだったんですけど、後からライブを見ることもできます。

この内容が面白すぎて「これはもうすぐに動画にせねばな」ということで撮っておりまして。この、今回紹介されている動画の内容を実際に映像を一緒に見ながら振り返って確認していければなと思うんですけれども。

この動画を見ることによって「GPT-4、マジヤバイな」ということが、僕もさっきびっくりしてテンションめちゃくちゃ上がって動画を撮ってるんですけど、一緒に体感することにより「もう世界が根本的に変わってくるな」と。

「こんなことも出来ちゃうんだ」ということが分かり、「これからの世界、どうやってこれを活用していくのか?」という気持ちにガラッと変わっていくんじゃないかなと思うので、是非一緒に確認していきましょう。

動画の内容





内容をこんな感じで。まず、可能性:1 落書きからコードやウェブサイトを作る。可能性:2 画像も認識出来ちゃう。可能性:3 複雑な税金計算も。可能性:4 驚異の文章能力。可能性:5 有能なプログラミング・アシスタント、そして最後に考察と学びを考えていきたいと思います。

順番は僕が驚いた順なので、ちょっと本編の動画とは順番が違うんですけど、僕が「これ、やばいな」と思った順に確認していきます。

このチャンネル「リモートワーク研究所」は、リモート時代に欠かせないツールやノウハウ・最新情報をお届けしています。定番ツールをゼロから学ぶコンテンツ、プラスアルファのテクニック、そしてChatGPTやGPT-4などの先端のニュースや動向をお届けしてるので、もしよければ是非チャンネル登録をよろしくお願いします。

可能性1:手書きの絵からコードが作れる


まずは、可能性の1・手描きの絵から、もはやウェブサイトとかコードを作れちゃう。さっそく動画を見ながら、どんな感じか確認していきたいと思います。

手書きのジョークサイトがありますよと。この手描きで作っているジョークのウェブサイトを写真で貼り付けますと。写真撮りますと。




これ、写真を撮ったやつをどうするかというと、ChatGPTに投げてこの真ん中のところですね、ちょっと見にくいと思うんですが、「Write brief HTML/JS to turn this mock・up into a colorful website.」。

「ウェブサイトに変えるためのHTML作って」、画像を一緒に貼り付けてます。そしたら、これがどうなるのかと言う話になるんですけれども、実際にさっきの画像がウェブサイトのコードになりまして、これ出来ちゃいましたと。




さっきのこの手描きの画像を実際にHTMLをコピーして、HTMLのところに張り付けると、実際に今、画像にあるようなHTMLのウェブサイトが出来ちゃったと…そういうことですね。

元々は手書きのこれでしたと。これが、ただGPT-4に指示して「サイト作れ」というだけで、実際に動くこういうウェブサイトになっちゃってますよというのが最初のデモになります。個人的には、これが一番びっくりしました。「これは、やばいな」と。手書きの絵からコードが出来ちゃうと。

今回は「手書きの絵をHTMLにしてくれ」ということを言ってるわけなんですけど、もちろんHTMLだけではなくて「この手書きの絵をもっと違う形にしてくれ」とか「本当に綺麗に絵に描いてくれ」とかでもそうかもしれないですし、「この絵からExcelのコードを作ってくれ」とか「この絵を分析して○○してくれ」。コードに限らず手書きからいろんな物が作れちゃうと。

実際、仕事においては手書きで資料の形を作って、これを実際に「PowerPointに直してね」みたいなことを今、仕事上で立場の上の方は部下に指示してやったりしていると思うんですが、そういうことがもはやGPT-4を使うと現実になりつつあると…現実になっちゃいましたね。

ということで、「これ、めちゃくちゃやばいな」というのが可能性の1つ目、手書きの絵からいろんな物に変換出来ちゃうと。

可能性2:画像も認識


続けて。可能性の2つ目、ChatGPTとかGPT3.5の段階では、基本的にテキスト文章だったんですけれども、もはや画像も認識出来ちゃうよと。

しかも、ちょっとこれ今回は画像認識を「DISCORD」というチャットツール上でやってる訳なんですけど、普段のチャットの中で画像をあげたら、その画像の認識が出来ちゃうよというのがデモにあるので、これを見ていきたいと思います。




これはですね…これちょっと見づらいと思うんですけど、真ん中にこの「DISCORD」自体の画像が貼られてまして「この画像ってどういうものか、具体的に説明してくれ」という風に指示を出しています。この真ん中のところですね。




この結論というか、文章内容がこちらになる訳なんですけれども、この画像をアップしたものに対して実際どういうものかというところで、このイメージは「DISCORD」のスクリーンショットですよねと。センターにはこんなことがあって、ライトにはこんなことがあってっていうことをかなり詳細に説明してくれています。

それを…ちょっと分かりづらいですかね?「DISCORD」というチャット上で画像を投げて、その画像の中身が更に「DISCORD」のスクリーンショットでした。その内容を説明してくれています。

ちょっとこれは凄いんですけど、分かりづらいのでもっとわかりやすい例に行きます。




こんな宇宙飛行士のスーツを着ている人がスキー場で滑っているというところで「これって何ですか?説明してくれ」ということを言うと、いま下に説明文書いてあるわけなんですけど、このイメージというのは「宇宙飛行士がスキーのような形で滑っているランドスケープですよ」という説明が書いてくれています。




もう1個、例が紹介されていまして、このリスがカメラを写ってる絵。「これって何が面白いの?」と「What's funny about this image?」という質問をしてるんですけど。それに対して、これがなぜ面白いかというと「普通、リスっていうのはカメラ使えないんだけども、それを手に持ってやってるのが面白いのよ」と。

「普通はリス、ナッツ噛んでるけどそうじゃなくて、そうじゃない人がカメラを持ってるって様子が面白い雰囲気です」みたいな形で画像の中身がわかっているだけではなく、その文脈というか面白さや中身の解釈まで出来てしまっているということが、画像認識という機能になってまして、これもすごいなと。

この画像認識力があるので、さっきの「手書きからコード」っていうところも出来るわけなんですけど、こういう機能も備わってしまってると。

しかも、これが普段のこのチャット上で簡単に行えるような導入が出来ちゃうので、例えば「Teams」とか「Slack」とか「ChatWork」とか、もしくは普通に「LINE」なんかでも、「こんな画像あったよね?」って送ったら、それをGPTに「ちなみにこれってどういうこと?」って聞くと、普通に返信してくれて解説してくれたり、内容を教えてくれたりすると。

こんなことがもうすぐ出来ちゃうというのが画像認識で、かつ画像認識が普段のコミュニケーションに埋め込まれているというところで「これ、えらいこっちゃな」ということが、2つ目にありました。

可能性3:有能なプログラミング・アシスタント


3つ目。複雑な税金計算も出来ちゃうよということで、これも相当すごいです。実際に動画を見た上で、何がすごそうかを見てみたいと思います。




今ですね、これは「税金を計算したいですよ」ということが書いてあって、右側に条件として結構複雑な条件に書いてあるんですね。「〇〇、いつ結婚して、子供がいて、〇〇で〇〇で…」っていうのがこの状況として書いてありますと。

この状況を踏まえた上で「2018年はどういった状況ですか? いくら必要なんですか? いくら免税されますか?」みたいなのを聞いてありますと。




ここに対して、どういう風にこれを計算させるかというと、この前提として指示に書いてある上の上のところに、税金の条件みたいなことが大量に書いてあるんですね。




こんな感じで、要は「こういう条件だったらこうなります」ってような、結構複雑な税金の条件の文書を前提条件として書いてまして、「このケースならこう、このケースならこう…」ということをこちらに張り付けています。

これを貼り付けた上で「この条件に基づいて計算してくれ」と言うとどうなるかというと、計算の結果が返ってくると。「○○の条件に基づくと、この条文を確認したところ、こういうことですよね?」ということで「何でこれがこの金額なのか?」という過程も含めて説明してくれちゃってると。

これは今回、税金の計算という例で書いてあるだけですけど、もちろん法律であったり、もっと複雑な数学であったり。要は何かしら条件を設定して、その条件に合うかどうかみたいなことを簡単に確認ができるということかなと思うので、この条件を事前に設定し、それに基づくと「今、これは何ですか?」っていう、かなり複雑な専門家でも読み込まなきゃ分からないことが、このように理由も含めて解説・答えが出ちゃうということになってるってことですね。




更に、もうちょっと進みまして「実際、いくらがいくらなんですか?ってことを計算しろ」というと、このように仮定をちゃんと明確にして、どういう理由でいくら計算が必要なのか、いくら税金が必要なのかってことを計算してくれちゃってると。

これがあることで、実際、自分で確認しに行って動画でも「まだ完璧じゃない」って話がされているんですけど、過程も明確なので、どこの部分が間違ってるか何かも、こうだったら分かりますよね? ということで、こんなことまで出来ちゃってると。

こういうのってやっぱりある程度、前提条件とか知識がなきゃ出来ないので、専門家の必要性があった訳なんですけど、そういったことも事前にインプットをこのようにするだけで出来ちゃうということで、やばいというような可能性3ですね。

可能性4:驚異の文章能力


可能性の4つ目、驚異の文章能力。これはめちゃくちゃすごいんですけど、ChatGPTの衝撃に比べると「あっ。よりレベルが上がったな」っていう感じではあるんですが、確かにすごいので見てみたいと思います。




何がすごいかというとですね…まずですね、この最初がGPT3.5の例でして、ある文章があって「この文章をGというアルファベットの言葉だけで訳せ」という指示を出してるんですね。

この驚異の文章能力ですが、まずこれ最初の指示としては、GPT3.5に「この文章をサマライズしてくれ」と「全てのワードはGという言葉から始まるようにしてくれ」っていうことを3.5に指示を出しているんですけど、残念ながら3.5はそこまで出来なくて「Gじゃない言葉も使ってサマライズしてくれ」と、サマライズの内容自体は悪くないけど、やっぱそこまでは出来ないよねという感じだったんですが、GPT-4でやるとどうなるかと。




GPT-4で同じことを指示するとどうなるかというと、今出ているような感じでちょっと見づらいかもしれんですけど「GPT-4 generates groundbreaking, grandiose gains, greatiy gaivanizing generalized AI goals.」。
本当にGで始まる言葉だけで文章をサマライズしちゃってるんですね。ここまで文章能力が上がっちゃったと。
これ、次の例がですね。「次はGじゃなくてAで始まる言葉だけで訳してくれ」と。




どうなるか…このような感じで「GPT-4 achieves advanced advancements.」。実際、Aで始まる言葉だけで訳してくれちゃってると。

次は、Qで始まる言葉だけで訳してくれという同じこの指示を、そしたらQで始まる言葉だけでサマリを作ってるということで、あり得ないぐらいの文章能力を保持していて、人間がこれやろうと思っても大変じゃないですか?

言葉も思いつかないし、要約しようと思うとニュアンスも含めてこんな高度な文章生成能力、恐らくほとんどの人はないと思うんですけど、もう出来ちゃってるよというのが驚異の文章能力として、これまでのGPT3.5では出来なかったけど、4ならできるぜという感じで紹介されています。

更にですね。文章能力としては、これはもしかしたらある程度3.5の方が出来るかもしれないんですが、ある文章があった場合に「ある文章とGPT-4のブログの共通点を見出せ」と。「ひとつ、この文章とGPT-4のブログにある共通のテーマっていうのを見出してくれ」っていうことをやると。

このような感じで、この文章とGPT-4ブログでは、両方とも「making advanced technology more accessible …ユーザーフレンドリーにするということは、共通点があるのよ」という風に共通項を見出してくれると。

最後、ここで面白かったのが「いやいや、あんまりこれインサイドフルな共通点じゃないんで、もうちょっとインサイドフルにしてくれ」ということを指示すると、さらにもっと具体的に細かいこの2つのブログと記事の共通点というところを抽出して表現してくれると。

もう、このぐらい驚異的な文章能力・要約能力・トピック抽出能力が備わっているということがデモで言われていまして、これはこれまでのChatGPTが出た時の衝撃とかなり似ているわけなんですけれども、レベルめちゃくちゃ上がってるということにすごいというのがございました。

可能性5:有能なプログラミング・アシスタント


そして最後、有能なプログラミング・アシスタント。これもChatGPT段階で「ついに相当すごいな」と思っていたので、更に能力が上がってるって話になるんですけれども、実際見てみたいと思います。




これはですね、AIのプログラミングを作っていると。「DISCORD」というチャットツール上で「ChatGPTの能力を使えるようなコードを作ってくれ」ということを書いています。「あなたはAIプログラミングアシスタントで作ってくれ」と。作りたいのは、DISCORD上で動くGPT-4を使ったAPIを使った機能であると。

その中にちょっと面白かったのは、結構プログラミングって仕様が変わるので、ChatGPTとかGPTって2021年時点の情報で最新情報がないと。




なのでどうしているかというと、この上側の方で「新しい情報はこれですよ」というのを文章で入れた上で「そっちを解釈した上で作ってくれ」という風にやると、このような取り組みの指示ですね、何をするかって指示と具体的な行動が出てくると。

この辺はすでに今のChatGPTのレベル、GPT3.5でも出来ているものもある訳なんですけど、より解釈力が上がったりできることが増えてますよと。最後このデモではコードを実際動かすとしてエラーが出ると。




エラーが出た時にエラーの文書をコピーして、さっきの途中の追加でこのエラー文章を入れてあげるとどうなるかというと、このエラーを解消したバージョンを作ってくれたりすると。これは、今のChatGPTでも出来るんですけど、こんな感じで解消してくれるよと。

更にですね、自分の環境を含めてまたエラーが出ると。「自分が「JUPITER」っていう環境を使っていて、これどうしたらいいの?」っていうような質問をすると、そこに合わせてまた新しいのを作ってくれるということで、この動画の中でも結構ミスがあって、いきなり完璧な正答がバンと出るわけじゃないんですけど、こういう風にステップバイステップで「このエラーがあります。じゃあこうしましょう」「こういう環境だから違うって言われます。じゃあ、こうしましょう」という風にアシストしてくれて、めちゃくちゃ有能ですよね。

これをちゃんとやってもらおうと思うと、横に張り付いてもらって教えてもらわなきゃ出来なかったことが、AIに横についてもらうような形でアシストしながら作っていくことができる。こういうのがあるとやっぱり自分自身もサイトをこのChatGPTを使って、GPT-4ではなく3.5でやっているんですけど、特定のことに対しては観点がないので、何を調べたらいいかそもそも分からないんですね。

そういう時にアシストしてくれるとめちゃくちゃ楽で言葉さえ分かれば、そこから検索することもできますし、ヒントが得られるだけでも物事が進むんで、めちゃくちゃいいなって思ってるんですが、それが更にレベルアップしますよというのがデモで紹介されていました。

考察と学び





ということで、ガッとこの5つの可能性を挙げてきました。ここまでが動画の紹介で、ここからが自分自身の考察と学びになります。

1点目はまず、ChatGPTで受けた衝撃を凌駕する能力を持っちゃってるなと。

特に個人的にやっぱり一番びっくりしたのは、まず画像からコードができることで画像を認識し、どういうものかを解釈した上で、しかもそれを実際に動くウェブサイトにも出来ちゃってると。

これは明らかにウェブサイトだけではなくて、絵にすることもできるし、データベースの構造を作ることもできるし、いろんなアウトプットに繋がることは間違いない訳なんで、もはや手書きである程度のイメージがあれば、それを伝えるだけでいろんなことをAIが勝手にやってくれちゃう時代になったかなと。

ビル・ゲイツも言うだけで絵が描けちゃうということをインタビューで言っていましたけど、本当に出来ちゃってるなっていうことで、この可能性たるや本当にすごいことになるなというところで、すごい衝撃を受けました。

2つ目。今回はデモが基本的に「DISCORD」っていうチャット上でGPTを動かすっての結構長い時間使われたんですね。このような感じでチャットとかメールとかLINEとか日々の使ってるコミュニケーションの中にAIが入ってきて普通に使ってる。

人に相談するかのごとくAIに相談するっていうことがデモでも行われていて、デモでやってるってことはそういう絵を描いてるからあえてやっていると思うんですよね?

わざわざプログラミングのページじゃなくて「DISCORD」というチャットツールでやっているのは、それを基礎としてるんじゃないかなと思っていて、日常生活への浸透っていうのがどんどん進んでいくんだろうなと。

気付けば普通にAIに聞いてる、Siriを使ってるかのごとくAlexaを使っているかのごとく。GPTを使ってるっていうのは、本当にそう遠くない未来に起こっちゃってるんじゃないかなと感じました。

3つ目。これだけの能力があって、例えばさっきの文章能力。

「Gで始まるアルファベットだけで文章を要約しろ」こんなこと出来ないじゃないですか?人間には。めちゃくちゃ考えて何時間もかかると。

また、税金の計算。あれも専門家に聞かなきゃ分からないですよね? 自分で調べてやろうと思ったら何時間もかかると。そんなことが、ちょっとこういう使い方をしてるだけで一瞬で出来ちゃう。

AI使えるか・使えないかで、仕事の能力に致命的な差が生まれてくることは間違いないと。であるならば、やっぱりAIを使う側に行かないと。「AIって難しいから分かんないよね」と「あんまり使いたくないのよね」この姿勢だと、この数カ月とか数年ぐらいは何とかなるかもしれないんですけど、もう遠からずレベル差が付き過ぎちゃいますよね?

刀で戦ってるところから拳銃の時代になっちゃったら、刀って基本的には勝てないじゃないですか。もちろん勝てるシーンもあります、あるシーンでは。でも、多くの場合は負けるということになっちゃうんじゃないかなと思っていて、決定的な差がつけられないように、もしくは自分がつけるようにAIをどうやって使うかってことを真剣にやっていかないとヤバイなということを今日改めて感じました。

おすすめコンテンツ紹介


これで、今日の内容は以上になりまして、最後にこのチャンネルのおすすめコンテンツをご紹介します。

イーロン・マスクとかビル・ゲイツとか、OPEN AI代表がどんなことを考えてるのか?インタビューを要約した動画をご紹介しています。

ChatGPTを使う上では、質問文の作り方がカギなんですけれども、どんなふうな質問をするといいのか、こういうものをまとめています。

また、もはやスプレッドシートでExcelでもChatGPTの機能を使うことができまして、どんなふうに使うのかをご紹介したりしています。

今、紹介してるのは全部GPT3.5の前提だけですけど、GPT-4になって更にこれら紹介してるものがレベルアップしていくことは間違いなく、こういった動きは自分も面白いですし、いち早くお届けして自分も届けることで習得しなくちゃという危機感で正直やってるので、そんなことを一緒にできればなと思っています。

このチャンネルでは、こういった最新の情報であったり、あとはこれを具体的にどういうツールで使うかとか使い方があるのかみたいなことを、恐らく相当早く、なるべく分かりやすく届けようと思っていて頑張ってやってますので、ぜひチャンネル登録をお願いできれば幸いです。

また、今日の内容で思ったこと・感じたことあれば…あればというか、めちゃくちゃ皆さんあると思うんですけど、是非コメントいただいて一緒に考えていけると、自分自身の学びになると思いますし、私もすごい参考になってモチベーションになるので非常に嬉しいです。

ということで、またお会いしましょう。

リモートワーク研究所では、リモート時代に活躍して稼ぐためのツールの使い方やノウハウをどんどんご紹介していきます。是非チャンネル登録していただいて、私と一緒に学んでいきましょう。

動画