じつは、CD1枚には「たったの1時間」だけしか入らない…なんと、収録時間を7倍にする「データ圧縮」の、じつに驚くべき効果

写真拡大 (全3枚)

類稀なる高音質で、話題になったネットオーディオ。しかし、割高な価格とダウンロードのわずらわしさから一部のマニアにしか支持されませんでしたが、高音質定額制配信サービスの出現で、大きく変わろうとしています。

ベテランと言われるオーディオ愛好家の中にも、CDやレコードなどの「パッケージメディア(パッケージ音源)」によるオーディオなら知識も経験もあるが、ネットワークが重要になった最近のオーディオに関しては、専門用語の意味もわかりにくいと感じている人もいるかと思います。

はじめてネットオーディオに挑戦するオーディオファンや音楽ファンを対象に、機材の選び方、高音質ストリーミングのセッティング、煩わしいネットの設定などなど、聴き放題の“1億曲ライブラリー”を手にするノウハウをご紹介しましょう。

※この記事は、『ネットオーディオのすすめ 高音質定額制配信を楽しもう』の内容を再構成・再編集してお届けします。

音楽信号をデジタル信号に量子化する方法

アナログの音楽信号をデジタル信号に変換(量子化)する方式には、原理的に異なる2つの方式PCMとDSD(Direct Stream Digital)が主流です。DSDはソニーとフィリップスの商標で、PCMと同様に、方式を表す場合はPDM(pulse-density modulation:パルス密度変調)と呼ばれます。

この代表的な2つのデジタル化の方式を説明します。

PCM(パルス符号変調)

PCM は「pulse code modulation」の略で、日本語では「パルス符号変調」と呼ばれます。1969年にNHKが世界で初めてPCMによるテープレコーダーの試作機を完成させて以来、日本コロムビア(現デノンコンシューマーマーケティング)やソニーが中心になって開発し、1982年以来CDに採用されてきた方式です。CDの規格を例にとって、PCMの原理を説明します。

CDは音楽信号1秒間を44100に分割し、それぞれの振幅の大きさに応じて2の16乗(65536)通りの符号を付けてデジタル化します(図「PCMの原理」)。

DSD(PDM:パルス密度変調)

ΔΣ変調(デルタシグマへんちょう)とも呼ばれます。1960年代初めに東京大学の大学院生であった安田靖彦氏が開発し、ΔΣ変調と命名しました。

変調回路は、減算器(Δ)、加算器(Σ)、量子化器、スイッチの4つの部分からできています(図2-8)。この回路に音楽信号1秒間を2822400に分割した音楽信号が入力されます。入力されると、

まず減算器で入力された値から1つ前の値を引き算します

その値は加算器に送られ、1つ前の引き算の値に加算されます

加算された値は量子化器に送られ、あらかじめ決めておいた基準値(Vr)と比較し、Vrよりも大きければ1を、小さければ0を出力します

量子化器から出力された値はスイッチに入ります。スイッチは1が入力されたら基準値(Vr)を、0が入力されたらマイナスにした基準値(−Vr)を減算器に戻します

次の信号が入力され、1. から繰り返します

続いて、デジタル化された音声信号データのフォーマットについて見て見ましょう。

音声ファイルフォーマット

PCM(パルスコード変調)やPDM(パルス密度変調)によってデジタル化された音声データは、基本的には0と1の羅列であるので、テキストデータや画像データなどの データと区別がつきません。そこで、これが音声データであり、PCMでデジタル化されたのかPDMなのか、量子化のビット数やサンプリング周波数などの情報を付加する必要があります。これをメタデータと呼びます。

またデータ量をより小さくするために、「音声データの圧縮」を行うことがあります(次節の「音声データの圧縮」参照)。圧縮した場合、元にもどす(復号)時に「どのような方法で圧縮したか」という情報が、必要になります。

音声データは、ある「規則」にしたがってメタデータと圧縮の情報が書かれたファイルの中に格納されます。その「規則」のことを、ファイルフォーマット(ファイル形 式)と呼びます。

ファイルに格納される音声データはそのままの状態(非圧縮)か圧縮された状態(圧縮)で格納されます。マイクロソフト、アップル、ソニーなどで様々な音声ファイルフォーマットが開発されており、圧縮データ、非圧縮データ、その両方など、格納する種類によっても様々なファイルフォーマットが使われています。

デジタル化された音声データは、データ量を減らすために圧縮される場合があります。例えば、CD1枚に非圧縮のPCMデータを収録すると約1時間ですが、圧縮するこ とで約7時間も収録することが可能になります。ですからネットで配信する場合は、圧縮はたいへん有効です。

音声データの圧縮には、圧縮する前のデータと元に戻した(復号した)時のデータがまったく同じになる可逆圧縮と、同じにはならない(欠損がある)非可逆圧縮があります。非可逆圧縮の方がデータを小さくできますが、音質を考えるとオーディオファンには可逆圧縮の方が魅力的です。可逆圧縮はロスレス圧縮とも呼ばれています。

MP3やAACは非可逆圧縮の代表例で、iPodやスマートフォンで利用されています。小さなスマホに2000曲も収録できるのは、圧縮のお陰です。

種々の音声ファイルフォーマット

音声ファイルフォーマットは格納する音声データによって、大きく3種類に分類できます。

非圧縮音声データ

可逆圧縮音声データ(ロスレス圧縮)

非可逆圧縮音声データ

それぞれに数種類のフォーマットがネットワーク配信に使われています。一つ一つのフォーマットの違いを理解する必要はありませんが、音質を重視するなら1. →2. →3. の順、データ量の小ささでは3. →2. →1.の順であるということを覚えておきましょう。

代表的な音声ファイルフォーマットだけでも十数種ありますので、ここでは省かせていただきますが、気になる方は『ネットオーディオのすすめ』に一覧表を載せていますので、ぜひご覧ください。

ネットオーディオのすすめ 高音質定額制配信を楽しもう

CDをはるかに凌駕する音質で、話題になったネットオーディオ。初めてネットオーディオに挑戦するオーディオファン・音楽ファンを対象に機材の選び方から、煩わしいネットの設定まで具体的に分かりやすく解説します。

じつは「デジタル・アンプ」の高音質化が凄まじい勢いで進んでいる…劇的に進行している高級オーディオの「衝撃の小型化」