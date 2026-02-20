弁護士向けAI法務SaaS「AILEX」、ガイドライン・マニュアルをAIに読み込ませて質問できる「ナレッジベースAI」機能を搭載 - PDF等を登録するだけで専用AIチャットが完成、引用元付きで回答 -
AILEX合同会社（本社：東京都渋谷区、以下「当社」）は、弁護士事務所向けAI法務SaaS「AILEX（エーアイレックス）」において、ガイドライン・通達・マニュアル等のPDF文書を読み込ませ、その資料の範囲内でAIが引用付きで回答する「ナレッジベースAI」機能を2026年2月に搭載したことをお知らせいたします。
■ 開発の背景
弁護士の業務では、官公庁が発行するガイドライン、通達、逐条解説、業界団体の基準書、事務所内の業務マニュアルなど、膨大な参照資料を日常的に扱います。法律の条文は熟知していても、行政解釈の細部やガイドラインの具体的な記述までを正確に記憶することは困難です。
数十～数百ページの資料から該当箇所を探すために、何度もスクロールし、キーワード検索をかける。しかし、知りたい内容と文書中の表現が一致しなければ検索にヒットしない。日本弁護士連合会の調査によれば弁護士の年間平均労働時間は2,321時間に及びますが、こうした「探す時間」が弁護士の知的作業を圧迫し続けています。
一方、ChatGPTなどの汎用AIチャットに法律の質問をしても、モデルの学習データに含まれない特定のガイドラインの内容については正確に答えることができず、誤った情報を生成する「ハルシネーション」のリスクがあります。弁護士は「特定の資料に限定して、正確に答えてくれるAI」を求めていました。
当社は、この「資料を探す手間」と「汎用AIの不正確さ」という二つの課題を同時に解決するべく、本機能を開発いたしました。
■ 「ナレッジベースAI」機能の概要
本機能は、弁護士が参照資料のPDFをアップロードするだけで、以下の処理を自動的に実行し、資料限定の専用AIチャットを構築します。
（1）テキスト自動抽出
PDF、Word（DOCX）、テキストファイル、Markdownの4形式に対応し、アップロードと同時にテキストを自動抽出します。AILEX独自のPDF解析エンジン（PdfTextExtractor）により、外部サービスへの送信なしにローカル環境でテキストを抽出できます。
（2）チャンク分割
抽出されたテキストを約1,600文字（800トークン）ごとのチャンク（断片）に分割します。チャンク間には約200文字（100トークン）のオーバーラップ（重複）を設けることで、段落の途中で文脈が途切れることを防止しています。
（3）ベクトル化（Embedding）
各チャンクをOpenAI text-embedding-3-smallモデルで1,536次元のベクトル（数値配列）に変換します。これにより、キーワードの完全一致ではなく「意味的に近い」内容の検索が可能になります。たとえば「例外規定」と「適用除外」のように、表現が異なる同じ概念にもヒットします。
（4）質問応答（RAG方式）
ユーザーが質問を入力すると、質問文もベクトル化され、ナレッジベース内の全チャンクとの類似度が計算されます。上位5件の関連チャンクがAnthropic Claude APIに送信され、「参照資料の範囲内で」回答が生成されます。回答には参照元の文書名と推定ページ番号が付記されます。
（5）資料外の質問への対応
資料に記載がない内容について質問された場合、AIは「この資料には記載がありません」と明示的に返答します。汎用AIのように学習データから推測して回答を「でっちあげる」ことがないため、ハルシネーション（AI幻覚）のリスクが構造的に抑制されています。
