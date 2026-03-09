シェルパ・アンド・カンパニー株式会社

シェルパ・アンド・カンパニー株式会社（本社：東京都品川区、代表取締役CEO 杉本淳、以下「シェルパ」）は、自然言語処理分野における国内の主要学会である言語処理学会が2026年3月9日（月）から13日（金）に開催する、言語処理学会第32回年次大会（以下「NLP2026」）において、研究論文2件を発表します。なお、本研究の詳細については、学会発表時に公表予定です。

背景

近年、企業が開示する情報の範囲は、規制強化や投資家・取引先からの要請の高まりを背景に、財務情報に加え、環境対応や人的資本、ガバナンスなど多様化しています。それに伴い、これらのサステナビリティ関連情報の量は急速に増加しており、その多くがテキストや表・図を含むPDF形式で公開されています。

企業の情報開示実務においては、こうした構造化されていない文書から必要な情報を正確に抽出し、文脈を踏まえて解釈することが求められており、自然言語処理に加え、文章と図表などの視覚情報を統合して理解するAI技術へのニーズが高まっています。

このような技術を実務に適用していくためには、現実の業務文書を前提とした客観的な比較・検証環境が不可欠です。一方で、日本語の実務文書を対象とした検証基盤は依然として限定的です。このたびの2つの研究は、日本語文書の理解における評価基盤の整備を目的に、専門領域特化型と汎用型の双方から課題解決を図る取り組みです。

■論文概要

＜論文１.＞

日時：3/10（火）11:15-12:45／C会場「マルチモーダル / 音声言語処理 」（C2-24）

タイトル：「Omni-JDocVQA: 多種多様な文書を含んだ日本語視覚文書理解ベンチマークの構築」

著者：梶川怜恩、中山功太、小田悠介、神田峻介、赤部晃一、二宮崇、岡崎直観

概要：広範な文書種別ラベルと、文書内容に依存しない現実的な質問を特徴とする新しい日本語視覚文書理解ベンチマーク「Omni-JDocVQA」を構築

＜論文２.＞

日時：3/10（火）16:55-18:25／ Q会場「言語資源・アノテーションと評価」（Q4-10）

タイトル：「ESG-QA: 日本語ESG文書を対象としたマルチモーダル（※）質問応答ベンチマークの構築」

著者：佐多亮明、赤部晃一、神田峻介、小田悠介

概要：実務経験を持つ専門家の知見に基づき、非定型なレイアウトを含む日本語ESG文書の理解能力を「ページ検索」「回答生成」「領域検出」の3タスクで多角的に評価するベンチマーク「ESG-QA」を構築

（※）複数の異なる種類のデータを同時に処理し、統合的に理解・生成するAI技術

「NLP2026」開催概要

日時：2026年 3月 9日（月）～3月 13日（金）

会場：ライトキューブ宇都宮（栃木県宇都宮市宮みらい1-20）

主催：一般社団法人 言語処理学会

WEBサイト：https://www.anlp.jp/nlp2026/

※参加には、WEBサイトから事前登録が必要です。

シェルパは、「利益とサステナビリティが融合する世界を実現する。」のビジョンのもと、非財務情報のポテンシャルの“開放”を目指し、AIをはじめとするテクノロジーの研究開発を強化してまいります。

