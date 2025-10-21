メタデータ、大規模高精度RAG製品「ChatBrid」をKubernetes、Amazon EKS対応の完全スケールアウト化 ～大企業の全社RAG一本化や、数万人同時利用可能な大規模サービス対応に
メタデータ株式会社（所在地：東京都文京区、代表取締役社長：野村直之）は、社内外の大規模な知識を高精度に活用できるRAGエンジン「ChatBrid（チャットブリッド）」のサーバーを、Kubernetes、Amazon EKS対応の完全スケールアウト化しました。これにより、アクセスの急増時に数百、数千のサーバーインスタンスが自動生成されて動作するスケールアウトを実現。アクセス量が減少すればサーバー規模が自動的に縮小してコストを抑えることができます。本機能は本日よりBtoB受注を開始します。
■ 背景 ～ChatBrid,
ChatBridは、2023年4月18日の初版リリース以来、知識ジャンルごとに分けたデータセット、数10～数100を使い分け、アクセス権制御（https://metadata.co.jp/blog/2024/09/04/3735）を行うことで、複数の部門、多種多様な目的のRAG（Retrieval Augmented Generation）を、高精度なまま１本に統合してまいりました。必要十分な質と量の「影プロンプト（ユーザーに見えない隠しプロンプト）」だけを選択して、関連する知識レコード（チャンク）とともに、LLMへ送信する設計により、精度・速度・コストの最適化を実現しています。
【画像 https://www.dreamnews.jp/?action_Image=1&p=0000332223&id=bodyimage1】
■ 完全スケールアウト化の概要
「ChatBrid」のサーバーを、Kubernetes、Amazon EKS対応の完全スケールアウト化しました。これにより、アクセスの急増時に数百、数千のサーバーインスタンスが自動生成されて動作するスケールアウトを実現。アクセス量が減少すればサーバー規模が自動的に縮小してコストを抑えることができます。ピークトラフィック時の応答遅延を抑えつつ、平常時は必要最小限のリソースで運用することで、TCOの低減とユーザー体験の安定化を両立します。
■ 完全スケールアウト化のユースケース例
・全社横断のRAG一本化
事業部ごとの規程・製品マニュアル・営業資料など、権限の異なるナレッジを統合。社内横断の問い合わせが集中する時間帯でも、自動スケールにより応答品質、応答速度を維持。
・大規模キャンペーン／新製品発表時のアクセス急増
プレスリリース直後や大型施策で数万の同時アクセスが発生しても、インスタンスが自動増設されタイムアウトや順番待ちを抑制。離脱率の上昇を防ぎ、顧客体験を守ります。
・コールセンター・カスタマーサポートのSLA強化
チャットボット／オペレーター支援のRAGが問い合わせピーク（昼休み・就業直後）に集中しても、応答時間を一定に保ち、初回解決率とCSの向上に寄与。
・社内イベント・人事手続きシーズンの一斉アクセス
期初の人事異動・評価・福利厚生申請等、時期偏在する問い合わせが一時的に増えても、必要な時間だけ自動的に拡張。終了後は縮小してコスト最適化。
・パートナー／代理店向けポータルの同時接続増
共同販促やトレーニング開催日など、外部ユーザーが一斉にアクセスする場面で、外部公開RAGの可用性と速度を確保。
・BCP／障害時のレジリエンス向上
部分障害やクラスタメンテナンス時でも、健全ノードへワークロードを自動再配置。業務継続性を高め、復旧までのダウンタイムを最小化。
・大規模ドキュメント更新の波に耐える運用
規程類や製品仕様の大量更新で再インデックスが発生しても、データ更新系と対話系を分離スケール可能。運用時間内の応答遅延を抑えます。
・マルチテナントSaaS提供
テナントごとに隔離したワークロードを必要に応じて増減。ピークが重なる時間帯でも、各テナントの体感性能とデータ分離を両立。
■ 受注開始時期
2025年10月21日
配信元企業：メタデータ株式会社
■ 背景 ～ChatBrid,
ChatBridは、2023年4月18日の初版リリース以来、知識ジャンルごとに分けたデータセット、数10～数100を使い分け、アクセス権制御（https://metadata.co.jp/blog/2024/09/04/3735）を行うことで、複数の部門、多種多様な目的のRAG（Retrieval Augmented Generation）を、高精度なまま１本に統合してまいりました。必要十分な質と量の「影プロンプト（ユーザーに見えない隠しプロンプト）」だけを選択して、関連する知識レコード（チャンク）とともに、LLMへ送信する設計により、精度・速度・コストの最適化を実現しています。
【画像 https://www.dreamnews.jp/?action_Image=1&p=0000332223&id=bodyimage1】
■ 完全スケールアウト化の概要
「ChatBrid」のサーバーを、Kubernetes、Amazon EKS対応の完全スケールアウト化しました。これにより、アクセスの急増時に数百、数千のサーバーインスタンスが自動生成されて動作するスケールアウトを実現。アクセス量が減少すればサーバー規模が自動的に縮小してコストを抑えることができます。ピークトラフィック時の応答遅延を抑えつつ、平常時は必要最小限のリソースで運用することで、TCOの低減とユーザー体験の安定化を両立します。
■ 完全スケールアウト化のユースケース例
・全社横断のRAG一本化
事業部ごとの規程・製品マニュアル・営業資料など、権限の異なるナレッジを統合。社内横断の問い合わせが集中する時間帯でも、自動スケールにより応答品質、応答速度を維持。
・大規模キャンペーン／新製品発表時のアクセス急増
プレスリリース直後や大型施策で数万の同時アクセスが発生しても、インスタンスが自動増設されタイムアウトや順番待ちを抑制。離脱率の上昇を防ぎ、顧客体験を守ります。
・コールセンター・カスタマーサポートのSLA強化
チャットボット／オペレーター支援のRAGが問い合わせピーク（昼休み・就業直後）に集中しても、応答時間を一定に保ち、初回解決率とCSの向上に寄与。
・社内イベント・人事手続きシーズンの一斉アクセス
期初の人事異動・評価・福利厚生申請等、時期偏在する問い合わせが一時的に増えても、必要な時間だけ自動的に拡張。終了後は縮小してコスト最適化。
・パートナー／代理店向けポータルの同時接続増
共同販促やトレーニング開催日など、外部ユーザーが一斉にアクセスする場面で、外部公開RAGの可用性と速度を確保。
・BCP／障害時のレジリエンス向上
部分障害やクラスタメンテナンス時でも、健全ノードへワークロードを自動再配置。業務継続性を高め、復旧までのダウンタイムを最小化。
・大規模ドキュメント更新の波に耐える運用
規程類や製品仕様の大量更新で再インデックスが発生しても、データ更新系と対話系を分離スケール可能。運用時間内の応答遅延を抑えます。
・マルチテナントSaaS提供
テナントごとに隔離したワークロードを必要に応じて増減。ピークが重なる時間帯でも、各テナントの体感性能とデータ分離を両立。
■ 受注開始時期
2025年10月21日
配信元企業：メタデータ株式会社
プレスリリース詳細へ