OpenAIの「gpt-oss-20b」を動かしているところ Photo: かみやまたくみ

ローカルLLMとは、ざっくり言ってしまうと「無料で公開されている大規模言語モデル」のことで、自分のPCにダウンロード・専用ソフトで読み込んで使います。ChatGPTのような“主流AI”へのアンチテーゼとして発展を続けており、専門サイトには試しきれないほどたくさんのローカルLLMが公開されています。

この記事では自分が触れた中から「幅広く多くの人におすすめできるローカルLLM」を紹介します。(1) 日本語が堪能で、日本語プロンプトにきちんと日本語で応答でき、(2) 推論性能も高い水準にあるもの、かつ(3) コンシューマ向けと呼べるPCで動くモデルを選定しています。

Google Gemma 3n E4B:MacBook Airで動く「入門用ローカルLLM」

Photo: かみやまたくみ

動かしやすさ:★★★★★

賢さ:★★★☆☆

汎用性:★★★★★

Googleが公開している「Gemma 3n E4B」は“かんたんに動かせるわりに賢い”のが特徴のローカルLLMです。標準的なスペックのマシンでも実用水準で動作するのに、一見難しく見えるニュース記事でも綺麗に要約・翻訳できたりします。コードなどもきちんと動くものを生成できます。

性能のいいローカルLLMは要求スペックが高く、処理にも時間がかかる傾向にあります。ローカルLLMでは「動かす敷居」は極めて重要で、「必要十分な性能の軽いモデル」がいちばん快適だったりします。Gemma 3n E4Bはまさにそんなモデル、なんならスマホでも動く軽さと手堅い賢さを両立した設計が本モデルの強みとなっています。

もちろん、限界を感じるシーンもありますけどね。

gpt-oss-20b:メインAIにしたすぎる「真の無料ChatGPT

表を積極的に用いる癖があり、回答はとても見やすい。
Photo: かみやまたくみ

動かしやすさ:★★☆☆☆

賢さ:★★★★☆

汎用性:★★★★★

OpenAIが公開しているローカルLLMであり、ベンチマークは以前ChatGPTに使われていたモデルと同等と高性能。わりと真面目に「無料ChatGPT」です。Reasoning Effortという独自機能を備え、「深い思考」が実現されているのも特徴的です。複雑なコンテキストの処理はもちろん、エージェントプログラムのテストなどにもいいと思います。

ネックは要求スペックが高めなこと。ゲーミングPCやメモリを盛ったMacなどなら実用できるかも、といった感じです。ChatGPTと機能的に同一でない点にも注意が必要です。

OpenAIらしい高い汎用性を感じられるモデルなので、本当に「動きさえすれば…」って感じです。日本語の理解力・表現力も高い水準で安定しており、普段使いから専門タスクまで十分に任せられます。

PLaMo翻訳言語の壁を破壊する国産「翻訳特化LLM」

Photo: かみやまたくみ

動かしやすさ:★★★☆☆

賢さ:★★★★☆

汎用性:★★★☆☆

Gemma 3n E4B・gpt-oss-20bは汎用性を重視した設計でしたが、特化型LLMにも非常に優秀なものがあります。壮絶な翻訳性能を実現している「PLaMo翻訳(plamo-2-translate)」は、「英語の最先端の情報」を読みこなしたいという人におすすめです。

plamo-2-translateは英語→日本語翻訳に特化したローカルLLMで、動作環境次第ではありますが50ページ近い超長文を1回で訳しきることも可能です。ChatGPT(GPT-5)やGemini(2.5 Pro)の訳文のほうが滑らかな印象ですが、長文すべてを訳すには分割が必要で手間がかかり、plamo-2-translateほど一貫したトーンにはなりにくいです。長ければ長いほどplamo-2-translate優位だと思います。

「運用がめちゃ楽」なのも大きな特徴です。なんとプロンプト不要、いちいち「あなたは優秀な翻訳者です…」とか書かなくていい。国際化を迫られる場面が増え続ける昨今、活かせるシーンはかなりあるのではないでしょうか。

特化型ゆえの大胆な設計が魅力の本モデルは、IoT関連のディープラーニング研究開発を行う日本のスタートアップが開発元です。国産AIの可能性を感じられるのも、いいところではないかと思います。

MacBookで無料AI。「ローカルLLM」がいい感じに進化してます

「LM Studio」ではじめるローカルLLM。“ガチ無料AI”を徹底解説

Source: Hugging Face