Metaの大規模言語モデル「Llama 3.1」をファインチューニングしたAIモデル「Hermes 3」がリリースされる
Metaが2024年7月23日にリリースした大規模言語モデル「Llama 3.1」を微調整したAIモデル「Hermes 3」が、2024年8月15日にAI開発企業の「Nous Research」からリリースされました。Nous Researchによると、Hermes 3はLlama 3.1よりも高度な推論や戦略的計画、意志決定に優れたプロフェッショナルな用途に適しているとのことです。
https://nousresearch.com/hermes3/
Unveiling Hermes 3: The First Full-Parameter Fine-Tuned Llama 3.1 405B Model is on Lambda’s Cloud
https://lambdalabs.com/blog/unveiling-hermes-3-the-first-fine-tuned-llama-3.1-405b-model-is-on-lambdas-cloud
NousResearch/Hermes-3-Llama-3.1-8B · Hugging Face
https://huggingface.co/NousResearch/Hermes-3-Llama-3.1-8B
Metaが2024年7月にリリースした「Llama 3.1」のパラメータ数が4050億の「Llama 3.1 405B」は、複数のベンチマークでGPT-4やGPT-4oを上回る結果を残していることが報告されています。また、「Llama 3.1 405B」と「GPT-4」「GPT-4o」「Claude 3.5 Sonnet」の出力結果を人間に比較させると、半数以上の被験者がLlama 3.1 405Bの出力結果を3種のモデルと同等以上と評価しました。
MetaがGPT-4超えのAIモデル「Llama 3.1」をリリース - GIGAZINE
そんなLlama 3.1をNous Researchが微調整したAIモデルが「Hermes 3」です。Nous Researchによると、Hermes 3は複雑なロールプレイングと創造的なライティングに優れており、より没入感のあるキャラクター描写、より深いシミュレーション、予想外の架空の体験をユーザーに提供するとのこと。以下はHermes 3とLlama 3.1の各モデルのベンチマーク結果を比較した表です。Nous Researchはこの結果について「Hermes 3はLlama 3.1よりも優れているとは言わないまでも十分な競争力があり、両者の間にはさまざまな長所と短所があります」と述べています。
すでにHermes 3を用いたチャットアプリのデモが以下のリンク先で公開されているので、実際に使ってみました。
Lambda Chat
https://lambda.chat/chatui/
「日本語は使えますか?」と尋ねたところ、「はい、もちろん使えます」との返答がありました。Hermes 3では問題なく日本語が使用できるようです。
実際にHermes 3とチャットした結果が以下。
Linuxのコマンドに関する質問も正しく回答してくれました。どの質問もかなり高速かつ高精度に回答してくれます。
なお、Hermes 3の各モデルは以下のリンク先から無料でダウンロード可能です。
Hermes 3 - a NousResearch Collection
https://huggingface.co/collections/NousResearch/hermes-3-66bd6c01399b14b08fe335ea