図の説明：マテリアルズインフォマティクスのために高度に柔軟な仕組みを備えたデータシステムが、様々な実験データを自動的に解釈し、可読性を高めた形式で保存する。

材料研究では膨大なデータが生成されるが、それらは測定器メーカー固有の形式で、用語も統一されていないため、集約・検索・比較・再利用が困難である。このため、こうした目的のために、従来、研究者はデータクリーニングに必要なメタデータ付与、フォーマット変換、特徴量の顕在化といった煩雑な作業に多大な時間を費やしてきた。この追加工程がデータの共有を妨げ、データ駆動型研究の進展を阻害している。この問題は、高品質なデータセットを必要とするAI駆動型材料研究の機運が高まる中で、さらに深刻化している。

この問題に対処するため、物質・材料研究機構（NIMS）の研究者らは、材料科学者向けの非常に柔軟なデータ管理システム「Research Data Express（RDE）」を開発した。『Science and Technology of Advanced Materials: Methods』誌に掲載されたRDEは、生データファイルや手動入力された測定値から実験データを自動解釈し、可読性に優れた共通化された形式で再構築・保存する手段を提供する。

「RDEは研究者の日常的なデータ処理負担を大幅に軽減し、データの発見可能性・相互運用性・再利用可能性（FAIR原則）および追跡可能性を向上させます」と、NIMS材料データプラットフォームの研究員で責任著者の藤間淳博士は説明する。「これにより、データ駆動型の共同材料研究が促進されることを期待しています」

RDEの核心は、多くのほかのシステムがするように記録結果としての「データセットの形式」を強制するのではなく、入力されたデータセットの形式を解釈するために「データセットテンプレート」という仕組みを導入したことだ。このテンプレートが、異なる実験種別からのデータをどのようにフォーマット・処理すべきかを、システムに「指示」する。たとえば、研究者がX線回折実験のプロファイル結果のスプレッドシートをアップロードするとき、適切なデータセットテンプレートを指定することにより、RDEはその中身を理解し、装置メーカーの違いに依らずグラフの描画やピーク位置・強度等の分析を自動実行する。異なる装置あるいは研究分野向けにテンプレートを準備できるため、データ管理の柔軟性が非常に大きい。利用者の多い実験装置にはテンプレートが事前に用意されているし、それで不足なら研究者が自らテンプレートを作ることもできる。

「データセットテンプレートの利用というRDEの独自のアプローチにより、研究者は自身の装置に合わせたデータ構造を自由に定義できる一方で、大量のデータの構造化とメタデータ抽出のシステムによる自動実行が両立できるのです」と藤間は説明する。

2023年1月のリリース以来、RDEは日本の材料研究コミュニティで広く採用され、その実用性を実証している。現在までに5,000人以上のユーザーを獲得し、様々な実験手法向けに1,900以上のデータセットテンプレートが実装され、これによって16,000以上のデータセット、300万以上のデータファイルが蓄積された。本システムは文部科学省が推進する「材料研究DXプラットフォーム」をはじめとする国家規模の取り組みにおけるデータ基盤として機能している。NIMSチームは研究コミュニティ内での利用促進を目的に、オープンソースのソフトウェアツールキット（RDEToolKit）も公開している。

論文情報

タイトル：Research data express: a data accumulation and sharing system for digital transformation in materials research

著者：Jun Fujima*, Hideki Yoshikawa, Hiroko Nagao, Hiroaki Tosaka, Takuya Kadohira & Masahiko Demura

*Materials Data Platform, National Institute for Materials Science, 1-1, Namiki, Tsukuba, Ibaraki 305-0044, Japan (E-mail: fujima.jun[at]nims.go.jp)

引用：Science and Technology of Advanced Materials: Methods Vol. 5 (2025) 2597702

最終版公開日：2025年12月15日

本誌リンク https://doi.org/10.1080/27660400.2025.2597702（オープンアクセス）