Qlean Dataset、「日本語・1話者・文学朗読音声コーパスとトランスクリプト」を提供開始
Visual Bank株式会社は、高品質な音声合成（TTS）モデルの学習や自動音声認識（ASR）の精度向上、および自然言語処理（NLP）の研究に最適化された、「日本語・1話者の文学朗読音声データセット」の提供を開始します。
本データセットは、日本文学や小説作品を対象とし、同一の日本人話者が全編を朗読した音声と、その内容を正確に書き起こしたトランスクリプトで構成されています。収録されている音声は、作品の情景描写や地の文を一定のテンポで丁寧に読み上げる朗読特有のスタイルを維持しており、長時間の文脈に沿った一貫性のある発話特性を有しています。感情の起伏を抑えた安定した調子から、文学的表現に基づいた微細な抑揚までが含まれるため、文脈を考慮した高度な音声生成技術の検証に適しています。
本データは、Qlean Datasetが展開するAI開発用オリジナルデータラインナップ「AIデータレシピ」の一つとして提供され、研究用途から商用利用を前提としたAI開発まで、幅広いフェーズでの活用を想定しています。Visual Bankおよびアマナイメージズは、今後も生成AIおよび音声・言語系AI開発の現場ニーズを踏まえたデータ提供を通じて、国内外のAI研究・開発を支援していきます。
今回提供を開始する「日本語・1話者・文学朗読音声データセット」の概要
[表1: https://prtimes.jp/data/corp/108024/table/151_1_91726f45e17845af08f4e94737a43f79.jpg?v=202603101051 ]
「日本語・1話者・文学朗読音声データセット」のユースケースイメージ
【研究用途】- 長尺文脈における音声合成（TTS）の韻律制御研究
数十分から一時間を超える長尺のテキストに対し、一貫した話者性を保ちながら、文脈に応じた自然なポーズや抑揚を生成するモデルの精度検証に利用できます。
【産業用途】- オーディオブック・ナレーション生成AIの開発
出版業界やエンターテインメント領域において、文学作品の複雑な構文を正確に読み上げるナレーションAIの学習データとして活用し、人間による朗読に近い自然なリスニング体験を実現する機能を開発できます。
- 文学表現に特化した自動音声認識（ASR）の音響モデル最適化
日常会話とは異なる文語体や特有の語彙が含まれる文学作品の音声を正しく認識・テキスト化するための、特定ドメイン向けASRモデルのファインチューニングに利用できます。
『Qlean Dataset（キュリンデータセット）』について
『Qlean Dataset』は、Visual Bank傘下の株式会社アマナイメージズが提供する商用利用可能なAI学習用データソリューションです。
画像・動画・音声・3D・テキストなど、多様な形式のデータに対応し、研究・商用いずれの用途でも安全に利用できる環境を整備しています。また、国内・海外のデータホルダーやラジオ・新聞社・通信社等のメディアとの協業を通じ、業界特化・最新トレンドに即したデータラインナップ『AIデータレシピ』を継続的に拡充しています。
Qlean Datasetは、AI開発現場におけるデータ収集・整備の負荷を軽減し、権利クリアで法的リスクのないAI開発環境の構築を支援します。
▶ Qlean Datasetサイト：https://qleandataset.visual-bank.co.jp/
▶ AIデータレシピ：https://qleandataset.visual-bank.co.jp/lineup
『Qlean Dataset』の提供するデータセット『AIデータレシピ』の特徴
- すべての被写体から同意取得
- 既存データは最短1日で納品可能
- カスタム撮影・収録・収集による独自データ構築にも対応
お問い合せ :
https://qleandataset.visual-bank.co.jp/contact
Visual Bank株式会社
AI開発力を最大化する次世代型データインフラを構築・提供するスタートアップ企業として、「あらゆるデータの可能性を解き放つ」をミッションに掲げ事業活動を展開。漫画家の「もっと描きたい！」をサポートするAI補助ツールを提供する『THE PEN』の他、AI学習用データセット開発サービス『Qlean Dataset（キュリンデータセット）』を提供する株式会社アマナイメージズを100%子会社に持つ。
また、Visual Bankは国の研究開発プログラム「GENIAC」にも採択され、社会実装に向けた取り組みを加速させています。
代表取締役CEO：永井 真之
所在地：〒107-0062 東京都港区南青山7-1-7 C-Cube南青山ビル6F
Visual Bank企業URL：https://visual-bank.co.jp/
アマナイメージズ企業URL：https://amanaimages.com/about/
Qlean Dataset Launches "Japanese Single-Speaker Literary Reading Audio Corpus and Transcripts"
~Visual Bank, a GENIAC-selected company, supports TTS and ASR development with audio and text data for the narration domain~
Visual Bank Inc. is pleased to announce the release of the "Japanese Single-Speaker Literary Reading Dataset," optimized for training high-quality Text-to-Speech (TTS) models, improving Automatic Speech Recognition (ASR) accuracy, and advancing Natural Language Processing (NLP) research.
This dataset features Japanese literary works and novels, consisting of audio narrated by a single Japanese speaker and matching high-accuracy transcripts. The recordings maintain a consistent, rhythmic narration style-ideal for descriptive passages and prose-and offer stable prosodic characteristics over long-form contexts. Containing everything from steady, controlled tones to subtle inflections based on literary expression, this data is perfectly suited for verifying advanced speech synthesis technologies that require contextual depth.
Provided as part of the "AI Data Recipe"-Qlean Dataset’s original lineup of AI development data-this dataset supports a wide range of phases, from academic research to commercial AI implementation. Visual Bank and amana images inc. remain committed to supporting global AI R&D by providing data that meets the evolving needs of the generative AI and speech/language AI landscape.
Dataset Overview
[表2: https://prtimes.jp/data/corp/108024/table/151_2_116d6146854e499757b79df00484a5e9.jpg?v=202603101051 ]
Use Case Examples
【Research & Academia】- Prosody Control in Long-Context TTS: Validating model accuracy in generating natural pauses and intonation for long-form texts (30+ minutes) while maintaining speaker consistency.
【Industry & Commercial】- Development of Audiobook & Narration AI: Serving as training data for narration AI in publishing and entertainment to achieve human-like listening experiences for complex literary syntax.
- Acoustic Model Optimization for Literary ASR: Fine-tuning domain-specific ASR models to accurately recognize literary styles and vocabulary that differ from everyday conversation.
About Qlean Dataset
Qlean Dataset is a commercial-use-ready AI training data solution provided by Amana Images Inc., a subsidiary of Visual Bank Inc.
It supports a wide range of data types, including images, videos, audio, 3D assets, and text, enabling both research and commercial AI development in a legally safe environment.
Through collaborations with data partners such as Chiba Lotte Marines Co., Ltd. and Toyo Keizai Inc., Qlean Dataset continues to expand its specialized, industry-focused lineup known as the “AI Data Recipe.”
By reducing the operational burden of data collection and preparation, Qlean Dataset helps organizations establish AI development environments that are both legally compliant and risk-free.
▶ Qlean Dataset: https://qleandataset.visual-bank.co.jp/en(https://qleandataset.visual-bank.co.jp/en)
▶ AI Data Recipe: https://qleandataset.visual-bank.co.jp/en/lineup(https://qleandataset.visual-bank.co.jp/en/lineup)
▶ Japanese Llanguage Corpora: https://qleandataset.visual-bank.co.jp/en/products/japanese-language-corpora
Key Features of Qlean Dataset
- Existing datasets deliverable within one business day
- Custom data collection and recording services available
▶ Contact: https://qleandataset.visual-bank.co.jp/en/contact(https://qleandataset.visual-bank.co.jp/en/contact)
About Visual Bank Inc.
Visual Bank Inc. is a Tokyo-based startup building Next-Generation Data infrastructure to enhance AI development capabilities under the mission “Unlocking Data Accessibility.”
The company operates THE PEN, an AI-assisted creative tool for manga artists and the Qlean Dataset service.
Its subsidiaries include Amana Images Inc., one of Japan’s largest photostock providers; Qlean Dataset, which leads research and development in AI data; and THE PEN Inc., an AI-assisted creative tool for manga artists.
CEO: Saneyuki Nagai
Address: 6F, C-Cube Minami Aoyama Building, 7-1-7 Minami-Aoyama, Minato-ku, Tokyo 107-0062
Corporate Site: https://visual-bank.co.jp/en(https://visual-bank.co.jp/en)
Amana Images: https://qleandataset.visual-bank.co.jp/en/company-overview(https://qleandataset.visual-bank.co.jp/en/company-overview)