第2章で紹介したように、SACDディスクの4.7GBのレイヤーは、2チャンネルの高品質(DSD)ステレオと6チャンネルの高品質(DSD)サラウンドサウンドの2つの完全な74分バージョンの音楽を保存できます。 このような量のデータは、フィリップスによって開発され、直接ストリーム転送(DST)と呼ばれる新しいロスレス符号化方法のおかげで、単一のレイヤに格納することができます。 | ||||
実際、 DSDシグマデルタ変調は、高いオーバーサンプリングレートをもたらし、生のオーディオデータ容量をもたらし、これは通常、現在のCD信号に必要とされる4倍の高さである。 | ||||
したがって、すべての高密度チャネルを単一のレイヤーに格納するには、データの削減が必要です。 一般に、2つの異なるタイプのビットレート低減方法がある:一方で、損失のあるデータ削減方法は、無視できる元の信号の部分を選択し、これらの部分を最終的なデータストリームから除去してデジタル形式で記憶する。 これらの損失の多い方法は、しばしば心理音響モデルに基づいており、ビデオ信号の場合はMPEG-1とMPEG-2、オーディオ信号の場合はドルビーデジタル(AC3)とDTSが含まれます。 | ||||
一方、ロスレス符号化方法は、主にコンピュータアプリケーション用に開発されてきた。 オリジナルのデータの整合性を維持しながら、データの量を削減します。 シグマ - デルタ変調されたDSD信号は、本質的に非常にノイズの多い構造を有するが、ロスレス符号化がうまく適用され、その結果、記憶または伝送に必要な容量が低減されることが判明した。 ダイレクトストリーム転送は、データフレーミング、適応予測およびエントロピー符号化段階を含む非常に洗練された符号化方法である。 | ||||
ロスレス符号化ストリームのランダムアクセスを可能にするために、このロスレス符号化方式は実際にはフレーム単位で動作する。 予測係数などの符号化パラメータは、フレームごとに1回最適化される。 | ||||
エントロピー符号化段階は、シンボル出現確率の不均一な分布を利用する。 言い換えれば、最も短いシンボルは最も頻繁なシンボルに割り当てられ、最も長いコードは最も少ないシンボルに割り当てられる。 置換テーブルは、符号化フェーズ中に構築され、最終符号化データとともに送信されなければならない。 DSTの場合、エントロピー符号化は適応的であり、すなわち、圧縮される音声データに関する統計に依存する。 | ||||
テキスト(ASCII)文書の場合、このタイプのエンコード方法は、いくつかの文字(ex:e)が他よりも出現確率が高い(ex:x)ので、非常に効率的です。 低振幅値がより再発する(ガウス確率)ため、PCM信号でも非常に良い結果が得られます。 しかし、基本的なエントロピー符号化は、振幅がパルスに関連し、絶対振幅値には関係しないので、DSD信号ではあまり効率的ではない。 結果として、新しい適応予測方法が開発された。 | ||||
実際、バッファサイズや処理能力などのシステムパラメータを決定するには、実現可能な最低のフレーム符号化利得が重要である。 したがって、達成可能な最低の利得を可能な限り高くすることが望ましい。 適応的なプレディシジョンフィルタ構造を可能にすることによって、任意のフレームの最悪の場合のロスレス符号化利得を通常改善することができることが分かった。 最悪の場合の符号化利得の改善は、利得変動を減少させ、その結果、バッファの出力における一定の符号化利得が増加する。 | ||||
したがって、ダイレクトストリーム転送では、データの整合性が失われることなく、ビットレートが50%低下します。 これは、必要なデータを半分にするということは、記憶容量を2倍にすることを意味するので、非常に印象的です。 | ||||
ダイレクトストリーム転送は、データフレーミング、予測、およびエントロピー符号化に依存する | ||||
要約すると、すべての可逆符号化方式は、入力信号の適切な選択を選択するフレーミング、冗長性を除去する予測、およびサンプルおよびサイド情報を効率的に符号化するためのエントロピー符号化を基本的には同じ構造を有する。 重要な問題は、これらのブロックを共同で最適化して、信号のクラスに対して最適な符号化利得を得、さらにアルゴリズムが実際に適用できるようにそれらの複雑さを最小限にすることである。 | ||||
1ビットのオーバサンプリングされたオーディオ信号であるDSDの場合、入力信号および出力信号は0と1の2つの表現値しか持たないので、ブロックは大幅に簡略化することができる(特に予測ブロック)。ロスレス符号化および復号化方式次の図のようにDSDを表すことができます。 | ||||
DSDロスレスエンコーダ | ||||
DSDロスレスデコーダ | ||||
さらに、L = 37632ビット、すなわち75フレーム/秒の一定のフレーム長は、64×44.1kHzのオーバーサンプリングされたDSD信号の性能とシステム要件との間の良好な妥協点を提供することが分かった 。 | ||||
最後に、ダイレクトストリーム転送は、フレームベースで変化する高ゲインの可逆符号化方式であり、可変ビットレートとなり、特にディスクまたはテープベースのメディアの場合、アプリケーションによっては欠点となる可能性があります。 ほとんどの時間が一定の線形ディスクまたはテープ速度に対応するので、これらのメディアのビットレートを一定に保つことが実際には望ましい。 次に、バッファ制御機構を追加して、ロスレスコーダの出力における可変ビットレートを一定のゲインに対応する一定のビットレートに変換することができる。 | ||||
結論として、DSDオーディオ信号(2ステレオおよび6マルチチャンネルサウンド)の非常に高いビットレートは、適応型ダイレクトストリーム転送方式のおかげで、単一のディスクレイヤーに完全に格納することができます。 DSTは「無損失」のデータ削減に大きなメリットをもたらし、バッファ制御のおかげでディスクメディアに容易に適合させることができます。 |