もはや「ChatGPT」で騒いでいる場合ではない?
Anthropicが運営するAIのClaudeは、生成する文章が自然で機械的な印象を受けない。日本語で質問すれば、すべて日本語で答えてくれる(画像:Claude HPより)
日本で生成AIと言えば、OpenAIのChatGPTがその代名詞。この傾向は日本でのオフィス開設も加わって、さらに高まっているが、そのOpenAIやGeminiをはじめとする多様なAIサービスを提供するグーグルと並んで存在感を示している企業がある。
このジャンルに注目している方ならばご存知だろうが、AnthropicというAI専業ベンチャーである。AnthropicはOpenAIの運営方針に異を唱えるメンバーがスピンアウトした2021年創業の生成AIスタートアップで、アマゾンとグーグルが巨額を出資していることでも知られる。
滑らかな文章を生成するClaude
同社の大規模言語モデル“Claude(クロード)”はその性能の良さから注目されていたが、特に注目を集めるようになったのは、今年3月4日に発表されたClaude 3からだろう。特徴的な性能や機能もさることながら、印象的だったのは生成する文章が実に自然で機械的な印象を受けないことだった。
Claudeはモデル規模(大きいほど賢く自然な応答になるがコストは高く、応答も遅くなる)に応じ、小さいほうから順に“Haiku”、“Sonnet”、“Opus”という3つが用意されている。
OpenAIがAPIのGPT-3.5やGPT-4oなどを提供する一方、チャットサービスのChatGPTを用意しているのと同様、AnthropicのClaudeはモデルサイズごとに異なる料金体系でAPI提供を行っているほか、“claude.ai”を通じてチャットサービスを提供している。
ユーザー登録すればSonnetまでは(処理量に制約は設けられているが)無料でも利用できる。
AI関連の開発者や、AIサービスの自社システムへの組み込みなどを検討しているなら、すでにClaudeの評価を行っているだろうが、ここでは一般的なビジネスパーソン向けに、Claudeのチャットサービスについて話を進めていきたい。
AIチャットサービスは、まずは登録して使ってみるところから始めてみるのがいい。
無料でお試しができるClaudeは中規模の“Sonnet”まで。これはChatGPTにおけるGPT-3.5に相当する規模(パラメータ数などは非公開)で、GPT-4oに近いと目される大規模なモデルは“Opus”で、こちらは有料版(月額20ドルでChatGPTと同じ)でしか利用できない。
Haikuを含むモデルは、推論モデルの世代ごとに用意されており“Claude 3 Haiku”のように世代とモデル規模の組み合わせで表現される。
Claude 3.5 Sonnetの驚くべき速度と性能
現在最新の推論モデルは3.5で、6月21日にClaude 3.5 Sonnetとして発表された。“Sonnet”の名称が与えられているように、もっとも大きな規模のモデルに比べると圧倒的に応答性がよく(=APIサービスとして呼び出す際にはコストが安い。Claude 3 Opusの2倍の速度でコストは半分)、制限付きながら無料版のチャットサービスから、その性能を確認できる。
まずはhttps://claude.ai/にアクセスして、いくつか質問を重ねてみたり、多様な言語の資料をPDFやWordのファイルで入力してその内容についてまとめさせてみるといい。日本語で質問すれば、すべての答えは日本語で返してくれる。
与える資料が会話を記録したものだったり、書き間違いや表記揺れが多いものであっても、十分な情報量があれば包括的に複数の文書から正しい確率が高い言葉を選びながら、全体的に話の筋が通ったレポートにしてくれるのはChatGPTと同様だ。
(画像:Claude HPより)
しかし即座に返答が返ってくる応答性、文章生成速度の速さには驚くはずだ。GPT-3.5よりも高速だ。そしてレポートの品質、特に日本語での言い回しは、より低速で規模の大きなGPT-4oやGemini 1.5 Proなどよりもずっと自然に感じられる。
またレポートする文章に含まれる情報量の多さも印象的だ。
ChatGPTはどの規模の言語モデルを選んでも、指定した文字数よりも少なめの情報しか出力せず、特定の情報に関してあまり掘り下げない傾向が強いが、Claude 3.5 Sonnetは要約しつつも抽出したトピックに関して、より深みのある情報を関連づけて言及する傾向がある。情報を省略して身近なレポートにする傾向も少なめで、多めの文字数を指定してもきっちりと言及してくれる。
初めて使った人は、このインテリジェンスの高さや出力文章の自然さを備えるAIチャットサービスが無償で提供されていることに驚くに違いない。
Claudeのより大きな驚きは“Opus”にあった
Claude 3.5 Sonnetをすっかり気に入った筆者は、すぐに有料契約を行った。
現在、3.5世代のClaudeはSonnetしか公開されていない。HaikuとOpusは3のみだ。Claude 3.5のHaikuとOpusは2024年後半に発表するとしており、その時期は明確ではないが、実際に有料サービスのClaude 3 Opusを使い始めると、その優秀性に驚いている。
Anthropicの資料によれば、Claude 3.5 Sonnetはより大規模なClaude 3 Opusよりもベンチマークスコアに優れている。自社内での比較だけではなく、ライバルと比べてもスコアの高さは明白だ。
これまでClaude 3が不得手だった映像解析能力が高くなり、資料の中にある図解やグラフなどを読み取る能力でOpenAIやグーグルのモデルに対してリードしている。
しかし有料サービスでClaude 3 Opusを使ってみると、文章の解析や事前学習された知識との関連づけ、より深く文脈を探る能力という面で、前述のように優秀性を感じていたClaude 3.5 Sonnetよりもさらに良い印象となり、その答えの品質は抜きん出ている印象を受ける。
追加資料を与えたうえでの質問の場合、より多くの資料を与えることが可能なうえ、資料ごとの関連性、さらには事前学習されている知識とを深く関連づけていく探索のプロセスが、より複雑かつ広範囲であることがうかがえる。結果としてより深みのある答えやアイデアを示してくれる。
(画像:Claude HPより)
会話を続けていくと、この知識同士の関連づけや質問に対する応答を次々に学習していき、会話のスレッドが長くなるほどに賢くなっていくことを感じる。まるで専門家やマニアのようになっていくのだ。
また、情報同士の関連づけがより深くなることで、誤った結論を導き出すことが少ない。ベンチマーク結果においては3.5 Sonnetのほうが優れているものの、より大規模なモデルである3.0 Opusは より、広範囲の情報を複雑に関連付けた長文を構成する能力にたけている。簡単に言えば"賢い"。
またChatGPTを使っていると、長い会話の中では冒頭で話をしていたり、指示をした内容を忘れていると感じることもあるが、Claude 3 Opusはまったくそのようなことを感じさせない。会話が長くなればなるほど、品質が高くなり、マニアックな回答をし始める。使う言葉遣いすら変化していくほどだ。
進化を続けるAIチャットサービスは、今日さまざまな機能を備えているため、単純に良し悪しを判断することは難しいが、少なくとも文書処理に関しての印象でいえばもっとも良い。Claude 3.5 Opusになった時、どこまでこの品質が向上するのか興味深い。
成果物を一覧できるArtifacts
さらに利便性という面では“Artifacts”という機能が気に入った。おそらくこのアプローチは他社も採用してくるだろう。
Artifactsと呼ばれる機能は、チャットサービスの中で作られたコンテンツをひとまとめにしたうえで、一覧からクリックするとすぐにアクセスできるという機能だ。アップロードした画像や文書などとともに示してくれる。
例えば文書としてまとめた製品やサービスの説明、事業計画などをアップロードし「新しい製品について、その特徴や可能性についてまとめ、プレゼンテーションスライドとしてのテンプレートを作成してほしい」と依頼すると、スライドのベースとなるアイデアを文書生成し、チャット履歴とは別にまとめておいてくれる。
(画像:Claude HPより)
データ構造のJSONの作成を依頼しても同様で、ウェブアプリのコードやベクターグラフィックスのSVGを生成させた場合は、コードとともにそのプレビューも示し、アプリであればその場で動かして動作確認もできる。
(画像:Claude HPより)
回答の根拠を質問できるのはChatGPTと同じだが、その引用元の示し方も詳細で、具体的な段落を幅広く表示してくれるため、意見の元となった情報を引き出しやすい。AIを活用するうえで、その回答がどこまで信頼できるものかを確認する作業は重要なものだが、それがとても簡単かつ素早く行えるようになっている。
ただすべてにおいてChatGPTを上回っていると言うわけではない。機能的に不足する部分もある。
例えば、“◯◯◯と◯◯◯に関して中国語で検索し、その結果について評価して特徴的な話題を5つ列挙せよ。さらにそれぞれについて、深掘りしたレポートを作れ”といった指示を行い、自分自身で検索して調べた情報と突き合わせてみるといった使い方を筆者はよく行う。しかし、ネットを検索してその結果を評価する機能はClaudeにはない。
画像生成に関しても対応していない。画像を解析して、それを文章として解説することはできるが、文章から画像を作成することはできない。
(画像:Claude HPより)
ただし、画像であっても出力がテキストである場合は生成可能。例えば、前述したようにベクターグラフィックスを記述するマークアップ言語のSVGなら出力できる。プレゼンテーションスライドに挿入するイラストをSVGで提案してほしいといった依頼は可能だ。
しかし、この中でネットを検索する機能に関しては、自分自身で必要な情報を揃えたうえで、その文章を与えてから分析していくほうが良い結果が得られる。これはウェブ検索を自動で行えるChatGPTでも同じ。検索結果の評価に関して、自分自身でどの結果を選ぶのかを判断することができるからだ。
個人向けAIチャットサービスは柔軟に選択することが重要
ChatGPTとClaude.aiを併用した結果、筆者の使い方では後者のほうが良いと判断して、切り替えることにした。しかしもちろん、ChatGPTで画像を生成しているような使い方をしている人はChatGPTのほうが良いだろう。また、手軽にウェブを検索できることもChatGPTの良さだ。もちろん検索ならばGeminiのほうが……といった意見もあるはずだ。
特徴や得意分野に合わせて、その時に最も良い選択肢を選べばいい。
ただ1つ言えるのは、どのAIモデルが優秀かといった競争は常に行われているということだ。今年に入ってからも短期間にさまざまなAIモデルが登場した。今回取り上げたクラウドも今年だけで大きなアップデートが2回入っている。おそらく開発競争が激しくなってきている。このジャンルは、互いのサービスのしのぎの削り合いが今後も続くだろう。
APIを通じて自社のシステムにAIサービスを組み込んでいく場合、どのAIモデルを選ぶかはとても重要なことだろう。
しかし個人で使うAIチャットサービスは、柔軟に選択できるように考えておくのがお勧めだ。具体的には長期のサービス契約を行うのではなく、月ごとに切り替えても良い準備をしておくのがいいだろう。
(本田 雅一 : ITジャーナリスト)