世界最先端のAI技術「特徴量自動設計」で、企業のデータ分析・利活用を革新する業界リーダーのdotData, Inc.（本社:米国 カリフォルニア州、CEO:藤巻 遼平、以下 dotData）は、本日、業務で蓄積されたテキストデータから“意味”を抽出して構造化する新サービス「dotData TextSense」を発表しました。

営業日報、お客様の声（VOC）、サポートチケット、従業員評価レポートなど、企業データの多くはテキストで蓄積され、経営・業務を変革し得る重要情報を含みます。従来のテキストマイニング（自然言語処理、トピック分析など）は専門スキルや辞書整備を要し、分析の活用は限定的でした。

dotData TextSenseは生成AIを用い、テキストから「意味」を高精度に抽出してラベル化（意味ラベル）します。これにより、構造化データと非構造化テキストを融合した深いインサイトの創出を、短時間で誰でも実現できるようになります。

深い文意を捉えたテキスト特徴量の抽出

dotData TextSenseは大規模言語モデル（LLM）により、単語の出現頻度に依存せず、文脈や意図を理解してテキストを意味ラベルとして構造化します。それにより、従来手法の課題を次のとおり解決します。

結果の解釈性：従来手法は単語や単語集合の出現に依存しており、文章の文脈やニュアンスの理解が不十分でした。たとえば「お客様」「訪問」という単語が含まれていても、「お客様を訪問しなかった」といった否定的な文脈を正確に解釈できず、抽出された特徴の解釈が難しいという課題がありました。

前処理や辞書の準備：テキスト分析には形態素解析などの前処理に加え、同義語・不要語の辞書が必要です。辞書の品質が分析精度を左右する一方、領域ごとの辞書メンテナンスには多大な労力を要していました。

適用範囲：センチメント分析やお客様の声分析など、アプリケーションごとに個別のモデル開発やツールが必要で、専門的なスキルが不可欠でした。結果として、テキストデータの潜在力に比べ、現実的な適用範囲が限定されていました。

dotData TextSenseは、LLMによる深い文脈・文意理解に基づいて「意味」をラベルとして抽出することで、(1) 高い解釈性と精度、(2) 前処理・辞書準備の最小化、(3) ユーザーが任意の「意味」を設計できる拡張性――を同時に実現します。

AIによる意味ラベルの自動推薦

テキスト活用には「何を抽出するか」という目的設定が重要です。dotData TextSenseは、ユーザーによるラベル定義に加え、AIがテキストを解析して「抽出すべき意味」を特定し、推奨ラベルとして提示します。これにより、作業効率に加え、設計の客観性・網羅性が向上し、誰でも高品質な意味ラベルを抽出できます。

評価結果からAIがプロンプトを自動調整

意味ラベルの抽出精度は、指示文（プロンプト）に大きく左右されます。これは「プロンプトエンジニアリング」と呼ばれる高度な作業で、初心者には難易度が高い領域です。dotData TextSenseでは、ユーザーが抽出結果に正誤のフィードバックを与えるだけで、その内容に基づいてAIがプロンプトを自動調整します。複雑なプロンプトエンジニアリングを行わず、確認とフィードバックのプロセスを通じて容易に精度を高めることができます。

構造化・非構造化データの融合したインサイトを導出

dotData TextSenseは、テキストデータを意味ラベルとして構造化します。これを業務データと組み合わせ、dotData Enterprise、dotData Feature Factory、dotData Insightなどに入力することで、非構造化テキストと構造化データを融合した深いビジネスインサイトを導き出します。



