Monday 11 December 2017

24/192音楽ダウンロード ...そしてなぜ彼らは意味をなさない



記事は先月、音楽家ニール・ヤングとアップルのスティーブ・ジョブズが「妥協しないスタジオ品質」のデジタル音楽ダウンロードを提供することについて議論したことを明らかにした。 プレスとユーザー解説の多くは、非圧縮24ビット192kHzダウンロードの見通しに特に熱狂していました。 数か月前にヤング氏のグループと私自身の会話の中で目立つようになった。

残念ながら、24ビット/ 192kHzフォーマットで音楽を配信することは何の意味もありません。 その再生忠実度は16 / 44.1または16/48に比べて若干劣り、6倍のスペースを占めます。

今日、デジタルで配信される音楽のオーディオ品質と「経験」には、いくつかの実際の問題があります。 24/192はそれらのどれも解決しない。 誰もが24/192を魔法の弾丸として固定しているが、実際の改善は見られない。
まず、悪いニュース

過去数週間、私は、24/192ダウンロードを信じて誰かがおそらく反対する可能性があることを知りたい、知的で科学的に志向の個人と会話しました。 彼らは詳細な答えが必要な良い質問をしました。

私はまた、高レートのデジタルオーディオのアドボカシーを動機づけたものに興味を持っていました。 応答は、基本信号理論やサンプリング定理を理解する人はほとんどいないが、これは驚くべきことではない。 数学、技術、生理学の誤解は、大部分の会話で生じ、多くの場合、重要なオーディオ専門知識を持っていた専門家によって主張されました。 サンプリング定理は実際にデジタルオーディオが実際にどのように動作するかを実際には説明していないと主張する人もいます。

誤った情報と迷信はチャーラタンにしか役立たない。 だから、なぜ24/192のディストリビューションが実際にいくつかの改善を提案する前に理にかなっていない理由のいくつかを説明しましょう。
紳士、あなたの耳を満たしてください

耳は、蝸牛の共鳴する基底膜上にある有毛細胞を介して聴く。 各有毛細胞は、膜上のその位置によって決定される狭い周波数帯域に効果的に調整される。 感度はバンドの中央でピークに達し、他の近くの有毛細胞のバンドと重複する片側のコーン形状のいずれかの側に落ちます。 聞こえるように調整された有毛細胞がない場合、音は聞こえません。

左上:ベーシックな膜が付いたヒトの蝸牛の解剖学的切断図。ベージュ色です。 膜は、その長さに沿って異なる周波数で共鳴するように調整され、基底近くではより高い周波数で、頂点ではより低い周波数である。 いくつかの周波数のおおよその位置がマークされています。

右上:オーバーラッピングフィルターのバンクとしての基底膜に沿った有毛細胞応答を表す模式図。

これは、チューナーが実際に設定されている近くの強力なステーションの周波数をピックアップするアナログラジオに似ています。 駅の周波数が遠くなればなるほど、どんなに強いかにかかわらず、それが完全に消えるまで弱く歪みます。 最後の有毛細胞の感度がゼロに下がり、聴力が終了する過去の上限(および下限)の可聴周波数限界があります。
サンプリングレートと可聴スペクトル

私はあなたがこれを何度も何度も聞いたことがあると確信しています。人間の聴覚範囲は20Hzから20kHzです。 研究者がどのようにそれらの特定の数字に到達するかを知ることは重要です。

まず、一群のリスナーのオーディオ範囲全体で、「聴覚の絶対的な閾値」を測定します。 これは、人間の耳が健康な耳に理想的な状況で測定された任意の所定の周波数に対して知覚できる非常に静かな音を表す曲線を与える。 無響音環境、精密キャリブレーションされた再生装置、厳密な統計解析は簡単な部分です。 耳と聴覚の両方が疲労を早く集中させるので、リスナーが新鮮なときにテストを行う必要があります。 つまり、休憩や休憩がたくさんあります。 テストは、方法に応じて数時間から数日かかるところがあります。

次に、反対側の極端な「痛みの閾値」のデータを収集します。 これは、オーディオの振幅が非常に高く、耳の物理的および神経的なハードウェアが入力によって完全に圧倒されるだけでなく、物理的な痛みを経験する点です。 このデータの収集は手間がかかります。 その過程で誰かの聴覚に永久的な損害を与えたくはありません。

上:Fletcher and Munson1933)に由来するおおよその等ラウドネス曲線と、周波数が> 16kHzの近代的な音源。 聴覚の絶対閾値および痛み曲線の閾値は赤色で示されている。 その後の研究者は、これらの測定値を洗練し、PhonスケールとISO 226標準の等ラウドネス曲線に達しました。 現代のデータは、耳がフレッチャーとマンソンの結果よりも低周波に対して有意に敏感でないことを示しています。

人間の音声範囲の上限は、聴覚曲線の絶対閾値が痛みの閾値を横切るところであると定義される。 その点(またはそれを超えて)でオーディオをあまりにも淡く知覚するためには、それは同時に目立たないほど大きな音でなければなりません。

低周波数では、蝸牛はバスレフのような働きをします。 ヘリコトリアは、個人に応じて40Hzから65Hzの間のどこかに調整されたポートとして働く、基底膜の頂点の開口部である。 レスポンスはこの周波数よりも急激に低下します。

したがって、20Hz20kHzは広い範囲です。 ほぼ1世紀の実験データに裏打ちされたアサーションである可聴スペクトルを網羅しています。
遺伝的贈り物と金色の耳

私の対応関係に基づいて、多くの人が特別な聴覚の贈り物を個人に信じています。 そのような「金色の耳」は本当に存在しますか?

あなたが金色の耳と呼ぶものに依存します。

若い健全な耳は、古いか傷ついた耳よりもよく聞こえます。 ほとんどの人が知らない音や音楽のニュアンスを聞くために、非常によく訓練されている人もいます。 1990年代には、すべての主要なmp3エンコーダをサウンドで識別することができました(両方がかなり悪い時に戻っていました)、これを二重盲検[ 2 ]で確実に実証することができました。

健康な耳と高度に訓練された差別能力が組み合わさると、私はその人を金色の耳と呼びます。 それでも、平均以下の聴力は、訓練されていない聴取者から逃れる細部に気づくことができます。 ゴールデンイヤーは、平均的な人間の物理的能力を超えた聴覚よりも訓練に関するものです。

聴覚研究者は、非常に長い聴力範囲のような、本当に優れた聴覚をもって、個人を見つけ、テストし、文書化するのが大好きです。 普通の人は素晴らしく、すべてですが、みんな本当にジューシーな紙のために遺伝的な変態を見つけたいと思っています。 私たちは過去100年のテストでそのような人々を見つけていないので、おそらく存在しないでしょう。 ごめんなさい。 私たちは探し続けます。
分光法

おそらくあなたは私が書いたばかりのすべてについて懐疑的です。 それは確かにほとんどのマーケティング資料に反する。 代わりに、既存のオーディオファイル荷物を運ばない仮想のWide Spectrum Videoの流行を考えてみましょう。

上:可視スペクトルに重ね合わされた人間の目のロッドとコーンのおよその目盛りの応答。 これらの感覚器官は、耳の有毛細胞が音の周波数の重なり合ったバンドに応答するように調整されるのと同様に、重なり合ったスペクトルバンドの光に応答する。

人間の目は、限られた範囲の光の周波数、すなわち可視スペクトルを見る。 これは、音波の可聴スペクトルに直接類似しています。 耳のように、目には異なるが重複する周波数帯の光を検出する感覚細胞(棒と錐)があります。

可視スペクトルは約400THz(深赤色)から850THz(深紫色)に及ぶ[ 3 ] 知覚は端に急に落ちる。 これらのおおよその限界を超えて、わずかな知覚のために必要な光パワーはあなたの網膜を揚げることができます。 したがって、これは、可聴域の寛大な限界に類似した、若くて健康な遺伝的才能のある個体でさえも、寛大な範囲である。

私たちの仮説であるWide Spectrum Videoの流行では、これらの限界が十分に寛大ではないと信じている猛烈なグループのSpectrophilesを考えてみましょう。 彼らは、ビデオは可視スペクトルだけでなく、赤外線と紫外線も表すことを提案しています。 比較を続けると、この拡張範囲はまだ不十分だと主張している、ハードコアと誇りに思っている派閥があります。ビデオには、マイクロ波といくつかのX線スペクトルも含まれています。 黄金の目に、彼らは主張する、違いは夜と昼です!

もちろん、これはばかげている。

誰もX線(または赤外線、または紫外線、またはマイクロ波)を見ることはできません。 人がどれくらい信じることができるかは問題ではありません。 網膜は単に感覚的なハードウェアを持っていません。

誰でもできることは次のとおりです:Apple IRリモートを入手してください。 LEDは、近赤外スペクトルで980nm、つまり約306THzで発光します。 これは目に見える範囲の外にはありません。 リモコンを夜中にあなたの家の中の最も暗い部屋、または地下室に持ち込み、消灯します。 あなたの目を黒さに合わせましょう。

上:Apple IRリモコンは、デジタルカメラを使用して撮影しました。 エミッタは非常に明るく、放射される周波数は可視スペクトルの赤い部分をはるかに超えていませんが、目には全く見えません。

あなたはボタン[ 4 ]を押すと、Apple RemoteLEDが点滅していますか? いいえ? ほんの少しの量でさえない? いくつかの他のIRリモートを試してみてください。 多くの場合、310350THz付近で可視波長帯に少し近づくIR波長を使用します。 あなたはそれらを見ることもできません。 残りは350~380THzの視界の端にあり、暗い調子の目で完全な黒さでほとんど見えません[ 5 ] すべてが目に見えるスペクトルの内側にいれば、驚くほど明るく、痛いほど明るいでしょう。

これらの近IR LEDは、目に見える境界から可視周波数限界を超えて最大20%まで放射します。 192kHzオーディオは、可聴限界の400%まで拡張されます。 私がリンゴとオレンジを比較しないように訴えられないように、聴覚と視覚は同様に端に向かって落ちます。
192kHzは有害とみなされます

192kHzのデジタル音楽ファイルにはメリットはありません。 どちらも中立ではありません。 実用的な忠実度はやや悪いです。 超音波は再生中の責任です。

オーディオトランスデューサもパワーアンプも歪みがなく、ひずみが最低周波数と最高周波数で急激に増加する傾向があります。 同じトランスデューサが可聴コンテンツとともに超音波を再生する場合、非線形性は、可聴スペクトル全体をカバーする混変調歪み製品の制御されないスプレーとして、超音波内容の一部を可聴範囲にシフトさせます。 電力増幅器の非線形性も同じ効果をもたらす。 その効果はごくわずかですが、リスニングテストでは両方の効果が聞こえることが確認されています。

上記:約0.09%の非高調波全高調波歪み(THD)を有する理論増幅器の30kHzおよび33kHzトーンの相互変調に起因する歪み生成物の図。 歪みのある製品は、いずれの音色よりも低い周波数を含め、スペクトル全体に現れます。

聞こえない超音波は、可聴域(水色の領域)における相互変調歪みに寄与する。 超音波を再現するように設計されていないシステムは、典型的には、20kHzを超える非常に高いレベルの歪みを有し、相互変調にさらに寄与する。 超音波を考慮に入れて設計の周波数範囲を広げることは、可聴スペクトル内のノイズおよび歪み性能を低下させる妥協を必要とする。 いずれにしても、超音波コンテンツの不必要な再生は性能を低下させる。

余分な歪みを避けるにはいくつかの方法があります:

    専用の超音波専用スピーカー、アンプ、およびクロスオーバ・ステージを使用して、聞こえない超音波を分離して独立して再現します。

    広い周波数再生用に設計されたアンプとトランスデューサは、超音波が可聴相互変調を引き起こさないように設計されています。 同等の経費と複雑さを考慮すると、この追加の周波数範囲は、スペクトルの可聴部分におけるいくらかの性能低下を犠牲にしなければならない。

    とにかく超音波を再現しないように慎重に設計されたスピーカーとアンプ。

    このような広い周波数範囲を最初からエンコードしていません。 超音波成分がない場合、可聴帯域に超音波混変調歪みを持つことはできません。

それらはすべて同じものになりますが、4)だけが意味を成します。

あなた自身のシステムのパフォーマンスが不思議であれば、次のサンプルには24/96 WAVファイルの30kHz33kHzのトーン、FLACのより長いバージョン、トライトーン・ウォーブル、および通常のソング・クリップがシフトされています24kHzアップするので、24kHzから46kHzまでの超音波音域になります。

    インターモードテスト:
        30kHzトーン+ 33kHzトーン(24ビット/ 96kHz [5秒間WAV] [30秒間FLAC]
        26kHz48kHzワーブルトーン(24ビット/ 96kHz [10秒間のWAV]
        26kHz96kHzワーブルトーン(24ビット/ 192kHz [10秒間WAV]
        ソングクリップを24kHz24bit / 96kHz WAV [10秒間のWAV]
        (上記のクリップオリジナル版) 16ビット/44.1kHz WAV

あなたのシステムが実際に完全な96kHz再生が可能であると仮定すると( 6 )、上記のファイルは、騒音、トーン、ホイッスル、クリック、または他の音なしで完全に静かなはずです。 何かが聞こえると、システムは超音波の可聴相互変調を引き起こす非線形性を持っています。 音量を上げるときは注意してください。 デジタルクリッピングやアナログクリッピングを実行すると、ソフトクリッピングしても、突然大きな混変調が発生します。

要約すると、特定のシステムでは、超音波による相互変調が聞こえることはありません。 追加された歪みは重要ではないか、または目立つことがあります。 いずれにしても、超音波コンテンツは決して利益ではなく、多くのシステムでは忠実度を聴覚的に損なうことになります。 それが傷ついていないシステムでは、超音波処理のコストと複雑さが軽減されたか、代わりに可聴範囲のパフォーマンスが向上しました。
誤解や誤解のサンプリング

サンプリング理論は、信号処理のバックグラウンドがなければ直感的ではありません。 他の分野の素晴らしい博士さえも、ほとんどの人が日常的に誤解していることは驚くべきことではありません。 多くの人が間違っていることに気づいていないことも驚くことではありません。

上:サンプリングされた信号は、しばしば元の信号の近似が悪いと思われる大まかな階段状(赤色)として描かれています。 しかし、表現は数学的に正確であり、信号は元の(青色)の正確な滑らかな形状をアナログに戻すと回復する。

最も一般的な誤解は、サンプリングが根本的に大雑把で損失性であるということです。 サンプリングされた信号は、しばしば元々完全に滑らかな波形のぎざぎざで、ハードコーディングされた階段状のファクシミリとして描かれています。 これがサンプリング作業を想起させる方法であれば、サンプリングレートが速く(サンプルあたりのビット数が多いほど)、階段が細かくなり、近似が近くなると考えられます。 サンプリングレートが無限に近づくにつれ、デジタル信号は元のアナログ信号に近づいて聞こえます。

同様に、多くのDSP以外の人々は以下を検討するでしょう:

そして、「ああ! サンプリングされた信号がより高い周波数のアナログ波形を悪く表すように見えることがあります。 あるいは、オーディオ周波数が増加すると、サンプリングされた品質が低下し、周波数応答が低下するか、入力位相に敏感になります。

見た目は欺かれている。 これらの信念は間違っています!

added 2013-04-04
私がデジタル波形と騒音について得たすべてのメールへのフォローアップとして、私たちのビデオDigital ShowTellの実際の機器での実際のデジタル動作を実演します。

ナイキスト周波数(サンプルレートの半分)を完全に下回るコンテンツを持つすべての信号は、サンプリングによって完全かつ完全にキャプチャされます。 無限のサンプリングレートは必要ありません。 サンプリングは周波数応答や位相に影響を与えません。 アナログ信号は、元のアナログ信号の正確なタイミングで、無損失で、スムーズに、再構成することができます。

計算は理想的ですが、現実世界の合併症は何ですか? 最も有名なのは帯域制限の要件です。 エイリアシング歪みを避けるために、サンプリング前にナイキスト周波数を超える信号をローパスしなければなりません。 このアナログローパスは悪名高いアンチエイリアスフィルタです。 アンチエイリアスは実際には理想的ではありませんが、現代の技術では非常に近いです。 ...それとオーバーサンプリングするようになる。
オーバーサンプリング

48kHz以上のサンプリングレートは、忠実度の高いオーディオデータとは無関係ですが、いくつかの最新のデジタルオーディオ技術には内部的に不可欠です。 オーバサンプリングは最も関連性の高い例である[ 7 ]

オーバーサンプリングは簡単で巧妙です。 私のデジタルメディア入門書Geeksでは 、高いサンプリングレートは、私たちが気にする最も高い周波数のオーディオ(20kHz)とナイキスト周波数(サンプリングレートの半分)の間に大きなスペースを提供することを思い出してください。 これにより、よりシンプルでスムーズで信頼性の高いアナログアンチエイリアスフィルタが得られ、忠実度が向上します 20kHzとナイキスト周波数との間のこの余分なスペースは、本質的にアナログフィルタのスペクトルパディングです。

上:48kHzADC / DAC(左)と96kHzADC / DAC(右)で使用可能なトランジションバンド幅を示すGeeks Digital Media Primerのホワイトボード図。

これは半分の話です。 デジタルフィルタは、アナログフィルタの実用的な限界がほとんどないため、デジタル化された効率と精度でアンチエイリアス処理を完了できます。 非常に高速のRAWデジタル信号は、デジタルアンチエイリアシングフィルタを通過します。このフィルタは、狭いスペースにトランジションバンドを適合させるのに問題はありません。 このさらなるデジタルアンチエイリアシングの後、余分なパディングサンプルは単に破棄されます。 オーバーサンプリングされた再生は、ほぼ逆の動作をします。

これは、192kHz以上のサンプリング(スムーズな周波数応答、低エイリアシング)と欠点(混変調歪み、無駄なスペースを引き起こす超音波)の忠実な利点をすべて備えた低速44.1kHzまたは48kHzオーディオを使用できることを意味します。 今日のアナログ/デジタルコンバータ(ADC)やデジタル/アナログコンバータ(DAC)のほとんどすべてが非常に高速でオーバーサンプリングされています。 完全に自動で隠されているため、これが起こっていることを認識している人はほとんどいません。

ADCDACが常に透過的にオーバーサンプリングするとは限りませんでした。 30年前、アナログ・フィルターのみを使用して高いサンプリング・レートでレコーディング・コンソールを録音したレコーディング・コンソールもありました。 デジタルアンチエイリアスとデシメーションのステップ(CDまたはDATの低速へのリサンプリング)は、マスタリングの最終段階で行われました。 これは、96kHz192kHzがプロの音楽制作に関連するようになった初期の理由の1つである可能性があります[ 8 ]
16ビット対24ビット

そう、192kHzの音楽ファイルは意味をなさない。 カバーされた、終わった。 16ビットと24ビットのオーディオはどうですか?

16ビットリニアPCMオーディオは、理想的な条件で人間の耳の理論的ダイナミックレンジ全体をカバーしていないことは事実です。 また、録音や制作に16ビット以上を使用する理由もあります(常にそうなります)。

それは再生には関係ありません。 ここでは24ビットオーディオは192kHzのサンプリングと同じくらい役に立たない。 良いニュースは、少なくとも24ビットの深度が忠実度に害を及ぼさないということです。 それは助けにならないだけでなく、スペースを無駄にします。
あなたの耳を再訪する

我々は耳の周波数範囲について議論しましたが、可能な限り最も柔らかい音から最大の可能な音までのダイナミックレンジはどうですか?

絶対的なダイナミックレンジを定義する1つの方法は、聴力の絶対閾値と痛み曲線の閾値を再度見ることです。 痛み曲線の閾値上の最も高い点と、聴覚曲線の絶対閾値上の最も低い点との間の距離は、若い健常な聴取者に対して約140デシベルである。 しかしそれは長く続くことはありません。 + 130dBは、数秒から数分で永久に聴力にダメージを与えます。 参考のために、1メートルのジャックハンマーは約100110dBです。

聴力の絶対的な閾値は、年齢および難聴に伴って増加します。 興味深いことに、痛みの閾値は年齢とともに増加するのではなく減少する。 蝸牛の有毛細胞自体は、耳の140dBの範囲のほんの一部を占めています。 耳の中の筋肉は、虹彩が眼に入る光の量を調節するのと同じように、耳小骨をシフトさせることによって、蝸牛に到達する音の量を連続的に調節する[ 9 ] このメカニズムは年齢と共に強化され、耳のダイナミックレンジを制限し、保護メカニズムの有効性を低下させる[ 10 ]
環境騒音

聴覚の絶対的な閾値が本当にどれくらい静かであるかを理解する人はほとんどいません。

非常に静かな知覚可能な音は約-8dbSPLです[ 11 ] Aウェイトスケールを使用すると、1m離れた100ワットの白熱電球からのハムは約10dBSPLなので、約18dB大きくなります。 電球は調光器ではるかに大きくなります。

20dBSPL(または最も静かな可聴音よりも28dB大きい)は、空の放送/録音スタジオまたは防音室で引用されることがよくあります。 これは非常に静かな環境のベースラインであり、おそらくあなたが電球を聞いたことに気付かなかった理由の1つです。
16ビットのダイナミックレンジ

16ビットリニアPCMは、ダイナミックレンジを(6 *ビット)dBとして計算する最も一般的な定義に従って96dBのダイナミックレンジを持ちます。 多くの人は、16ビットオーディオは-96dBよりも静かな任意のサウンドを表現できないと考えています。 これは間違っています。

私はここで2つの16ビットオーディオファイルにリンクしています。 1つは0dB1kHzのトーンを含み(0dBは可能な限り大きなトーンである)、もう1つは-105dB1kHzのトーンを含む。

    サンプル1 0dB1kHzトーン(16ビット/ 48kHz WAV

    サンプル2 -105dB1kHzトーン(16ビット/ 48kHz WAV

上記:16ビット/ 48kHz PCMとしてエンコードされた-105dBトーンのスペクトル解析。 16ビットPCM96dBよりもはるかに深く、そうでなければ-105dBのトーンを表現できず、聞こえません。

この信号をエンコードし、歪みを伴わずにエンコードし、そのピーク振幅が1/3のとき、ノイズフロアの上にエンコードすることは可能ですか?

このパズルの一部は、適切なディザによって解決され、量子化ノイズを入力信号とは無関係にします。 含意すると、これは、ディザリングされた量子化は歪みを導入せず、相関のないノイズのみを導入することを意味する。 これは、1ビットよりはるかに小さいピーク振幅を持つものであっても、任意の深度の信号を符号化できることを意味している[ 12 ] しかし、ディザでは、信号がノイズフロアの下に落ちると効果的に消えるという事実は変わりません。 -105dBのトーンは、-96dBのノイズフロアよりもはっきりと聞こえるのですか?

答え:-96dBのノイズフロアフィギュアは事実上間違っています。 私たちはダイナミックレンジの不適切な定義を使用しています。 6 *ビット)dBは広帯域信号全体のRMSノイズを与えますが、耳の各有毛細胞は総帯域幅の狭い部分にのみ敏感です。 各ヘアセルは、合計ノイズフロアエネルギーのわずかな部分しか聞こえないので、そのヘアセルのノイズフロアは、ブロードバンドの-96dBよりもはるかに低くなります。

したがって、16ビットオーディオは96dBよりかなり深くなる可能性があります。 量子化ノイズエネルギーを聞き取りにくい周波数に変換するシェイプディザを使用すると、16ビットオーディオの実効ダイナミックレンジは実際には120dBに達し、[ 13 ]96dBよりも15倍以上深くなります。

120dBは、同じ部屋のどこかの蚊とジャックハンマーの足の距離の差よりも大きいです。または、捨てられた「防音」ルームと、数秒で聴力障害を引き起こすのに十分な騒音との違い。

16ビットは、私たちが聞くことができるすべてを保存するのに十分であり、永遠に十分です。
信号対雑音比

耳のS / N比が絶対ダイナミックレンジよりも小さいことを簡単に言及することは重要です。 所与の臨界帯域内では、典型的なS / Nは約30dBに過ぎないと推定される。 幅広い帯域を考慮しても、相対的なS / Nはフルダイナミックレンジには達しません。 これは、線形16ビットPCMが実際に必要とされるよりも高い解像度を提供することを保証する。

オーディオ表現のビット深度を16ビットから24ビットに増やしても、オーディオの知覚可能な解像度または「細かさ」は向上しません。 ノイズフロアを下げることによって、可能な限り最も柔らかい音と最も大きな音との間のダイナミックレンジを増加させるだけです。 しかし、16ビットのノイズフロアはすでにわかっています。
24ビットはいつ問題ですか?

プロフェッショナルは、ヘッドルーム、ノイズフロア、および利便性の理由から、録音と制作で24ビットのサンプルを使用しています[ 14 ]

16ビットで実際の聴力範囲を十分に超えて余裕を持たせることができます。 オーディオ機器の可能な信号範囲全体には及んでいません。 録音時に24ビットを使用する主な理由は、間違いを防ぐことです。 あまりにも高いと思われる場合はクリッピングを危険にさらし、低すぎると思われる場合はノイズを追加することに注意してください.24ビットで、オペレータはおおよそのレベルを設定し、あまり心配する必要はありません。 最適なゲイン設定が数ビット欠けても影響はありません。記録された範囲を動的に圧縮するエフェクトは、深いフロアで動作します。

エンジニアは、ミキシングやマスタリング中に16ビット以上も必要とします。 現代の仕事の流れには、文字通り何千もの効果や操作が含まれます。 16ビットサンプルの量子化ノイズとノイズフロアは、再生中に検出されない場合がありますが、そのノイズに数千倍を掛けることは最終的に顕著になります。 24ビットは累積ノイズを非常に低いレベルに保ちます。 音楽の配信準備が整うと、16ビット以上を保持する理由はありません。
リスニングテスト

理解は、理論と現実が会うところです。 問題は2人が同意したときにのみ解決されます。

リスニングテストの経験的な証拠は、44.1kHz / 16ビットが最高の忠実度の再生を提供するという主張を裏付けています。 これを確認する多数の制御テストがありますが、ここでボストン・オーディオ・ソサエティの地元の人々が行った、 高解像度のオーディオ再生に挿入されたCD標準A / D / Aループの可聴性を最近の論文に取り上げます。

残念ながら、全文をダウンロードするには、AESのメンバーシップが必要です。 しかし、それは記事やフォーラムで幅広く議論されており、著者たちが参加しています。ここにいくつかのリンクがあります:

    天皇の新しいサンプリングレート
    水素オーディオフォーラムのディスカッションスレッド
    Boston Audio Societyの補足情報ページ。装置およびサンプルリスト

この論文では、高品位オーディオの主張者が高画質を誇示するために選んだ高レートDVD-A / SACDコンテンツと、16ビット/ 44.1kHzコンパクトにリサンプリングされた同じコンテンツを選んでリスナーに紹介しましたディスクレート。 リスナーは、ABX方法論を使用して2つの間の違いを特定するように挑戦されました。 BASは、アマチュアと訓練を受けたプロのリスナの両方と一緒に、騒音に孤立したスタジオの聴取環境でハイエンドのプロ用機器を使用してテストを実施しました

554回の試行では、リスナーは正確に49.8%を選択しました。 言い換えれば、彼らは推測していた。 テスト全体を通して1人のリスナーが16 / 44.1であったのか、それが高率であったのかを特定することはできませんでした。[ 15 ]16ビット信号もディザリングされませんでした。

もう一つの最近の研究[ 16 ]は、初期の研究が示唆したように、超音波が聞こえる可能性を調査した。 このテストは、相互変調積を最も聞こえる場所に配置することによって、検出の可能性を最大限にするように構成されていました。 それは、超音波音が聞こえないことを発見しました...しかし、スピーカーによって導入された相互変調歪み製品は、可能性があります。

この論文は、多くのさらなる研究に刺激を与えました。 あいまい性の中には、超音波が電力増幅器で予想されていたよりも多くの相互変調ひずみを誘発する可能性があることが分かっていることによって説明されています。 例えば、 David Griesingerはこの実験を再現し [ 17 ]、彼のスピーカーの設定は超音波からの可聴相互変調歪みを導入しなかったが、彼のステレオアンプはそうしていた。
警告

文脈や自己興味のある情報源から個々の論文や専門家の解説をチェリーピックすることは重要ではありません。 すべての論文がこれらの結果と完全に一致するわけではありません(そして、大部分では少し不一致)ので、想像を絶する結論を裏付ける少数意見を見つけるのは簡単です。 いずれにせよ、上記の論文とリンクは、実験記録の膨大な量と幅を表しています。 時間のテストを立てた査読済みの論文は、これらの結果と実質的に一致しません。 論争は、消費者と熱狂的なオーディオファンコミュニティだけに存在する。

何かがあれば、Googleが提供するあいまいで、決定的ではなく、完全に無効な実験結果の数は、正確で客観的なテストを構築するのが難しいことを強調しています。 研究者が探している違いは分かります。 彼らは、被験者の意識を逃れる潜在的な選択肢を見つけるために、厳密な統計分析を必要とする。 存在しないものを「証明」しようとしている可能性が高いことは、それをさらに困難にしています。 帰無仮説を証明することは、停滞問題を証明することと似ています。 できません。 あなたは圧倒的な体重を与える証拠のみを収集することができます。

それにもかかわらず、帰無仮説を確認する論文は特に強力な証拠である。 不可聴性を確認することは、それを論じるよりはるかに実験的に困難です。 テスト手法と機器の未知のミスは、ほとんどの場合、偽陰性ではなく、誤って肯定的な結果(誤って可聴差を導入することによって)を生じます。

プロの研究者が細かく孤立した可聴差を適切にテストするのに苦労している場合は、アマチュアにとってどれほど難しいかを想像することができます。
リスニングの比較を偶然にする方法

超高速オーディオの信者から聞いたナンバーワンのコメントは、 「私は自分自身で高音質のオーディオを聞いてきましたが、改善は明らかです。自分の耳を信じないように真剣に言っていますか?

もちろん、あなたの耳を信頼することができます。 それは嫌な脳です。 私はそっとそのことを意味するわけではありません。 人間として、私たちはすべてそのように配線されています。
確認バイアス、プラセボ効果、および二重盲検

リスナーがリスニング以外の手段で2つの選択肢を区別できるテストでは、結果は通常リスナーが予期していたものになります。 これは確認バイアスと呼ばれ、 プラセボ効果と同様です。 より安価な(あるいはより魅力的な)アンプを安価なオプションよりも好むように、オーディオとは関係のない潜在的な手がかりや好みのために、人々の聴き取りの違いを意味します。

人間の脳は存在しない場合でもパターンと相違点に気づくように設計されています。 この傾向は、人が客観的な決定を下すよう求められたときには、単にオフにすることはできません。 それは完全に潜在意識です。 偏見は単なる懐疑主義に打ち勝つこともできない。 コントロールされた実験は、効果を減少させるよりも、確認バイアスの意識が向上することを示しています!注意深く確証バイアスを排除しないテストは無益である[ 18 ]

では、単一盲検試験、リスナーは、テストの選択肢について事前に何も知らないし、テストの過程でのフィードバックを受けていません。シングルブラインドテストでは、カジュアルな比較よりも優れているが、それは排除しない実験者のバイアスを。テスト管理者は、簡単に不注意テストに影響を与えるか、(不注意による合図によってリスナーに自分の潜在意識のバイアスを転送することができます例えば、「あなたが聞いているものそれはだと確信していますか?」、「間違ったチョイスを示すボディランゲージなど、不注意に躊躇)。実験者のバイアスはまた、実験的に試験対象者の業績に影響を与えることが証明されました。

二重盲検リスニングテストは、ゴールドスタンダードです。これらの試験で、試験担当者も被験者もないが、テストの内容や継続的な結果のいずれかの知識を持っています。コンピュータ実行ABXテストでは最も有名な例であり、自分のコンピュータ上でABXテストを実行するために自由に利用できるツール[ある19 ]ABXは、リスニングテストの最小バーが有意義であると考えられています。以下のような評判の良いオーディオフォーラム水素オーディオは、多くの場合、彼らはこの最小客観要件満たしていない限り、でも聴いた結果の議論を許可しない [ 20 ]

上:Squishyball、簡単なコマンドラインABXツールは、xtermの中で実行されています。

私は個人的にABXツールなしで、どんなにカジュアル、開発中にどのような品質の比較テストを行いません。科学は、科学、無たるみです。
ラウドネスのトリック

人間の耳は、意識的に約1dBの振幅の違いを区別することができ、かつ実験は0.2デシベル下の振幅の違いの潜在意識を示しています。人間はほぼ普遍良い音して大声でオーディオを検討し、0.2デシベルは、この設定を確立するのに十分です。慎重な選択を振幅と一致するように失敗した任意の比較は、振幅差が通知を意識的にはあまりにも小さい場合であっても、大声選択優先が表示されます。ステレオセールスマンは、長い時間のためにこのトリックを知っていました。

プロのテストの標準は0.1デシベル内またはより良いのソースを一致させることです。これは、多くの場合、オシロスコープや信号アナライザを使用する必要があります。二つのソースがほぼ同じに聞こえるまで、ノブを回すことで推測することは十分ではありません。
クリッピング

クリッピングは振り返ってみると、時々、明らかに別の簡単な間違いです。でも、いくつかのクリップされたサンプルまたはその後遺症はクリップされていない信号に比べて聴きやすいです。

クリッピングの危険性は、オンザフライでデジタル信号を作成、再サンプリング、または他の方法で操作試験において特に有害です。私たちは、192kHzのソースサンプルには48kHzサンプリングの忠実度を比較するとします。典型的な方法は、アップサンプリングバック192kHzのに対して、48kHzのに192kHzのからダウンサンプリングし、その後ABX試験[192kHzのサンプルと比較することである21 ]。この構成は、私たちは、機器変動又は結果に影響を与えるサンプルスイッチングの可能性を排除することを可能にします。我々は両方のサンプルを再生するには、同じDACを使用して、任意のハードウェア・モードを変更することなく切り替えることができます。

残念ながら、ほとんどのサンプルは、フルデジタルレンジを使用することを習得しています。ナイーブリサンプリングは、多くの場合、時折クリップしますすることができます。クリッピングを監視(およびクリップされたオーディオを破棄)、または減衰のようないくつかの他の手段を介してクリッピングを避けるいずれかにそれが必要です。
異なるメディア、異なるマスター

私は「同じ」レコーディングのオーディオDVD(またはSACD)にCDを比較することによって、24ビットまたは96 / 192kHzのの美徳を宣言し、いくつかの記事やブログ記事全体を実行しました。この比較は無効です。マスターは通常異なっています。
不慮の手がかり

不注意な可聴合図は、古いアナログおよびハイブリッドデジタル/アナログ・テスト・セットアップのほぼ不可避です。純粋なデジタルテストのセットアップは完全にテストのいくつかの形態では、問題を解消するだけでなく、複雑なソフトウェアのバグの可能性を掛けることができます。このような制限やバグがテストで偽陽性の結果を引き起こす長い歴史[持っている22 ]

デジタルチャレンジ- ABXテストの詳細は、CDはビニールに本質的に劣っていたと主張した時間のオーディオマニア当局に反論するために1984年に行われ、特定のリスニングテストの魅惑的な物語です。記事は(私はあなたが推測することができるでしょう疑いがある)テストの結果にはあまり関係ありませんが、プロセスや実世界の乱雑には、このような試験を行うに関与します。例えば、テスターの一部に誤りが不注意招待オーディオマニアの専門家は、オーディオ忠実度に基づいて選択をするのではなく、ABXスイッチのアナログリレーによって生成わずかに異なるクリックを聞くことによってされていなかったことを明らかにしました!

逸話は、データを置き換えるものではありませんが、この話は、未発見の欠点は、バイアスリスニングテストできる容易さの有益です。内で議論オーディオマニアの信念のいくつかは、非常に面白いです。一つは、いくつかの近代的な例は、今から20年後、同じように愚かな考えられていることを期待しています。
最後に、良いニュース

何が実際に私たちが聴いているれるデジタルオーディオの品質を向上させるために働きますか?
より良いヘッドフォン

最も簡単な修正は、デジタルではありません。コストのための最も劇的な可能忠実度の改善は、ヘッドフォンの良いペアから来ています。過耳、耳の中に、開いているか閉じて、それはあまり問題ではありません。高価なヘッドフォンはお金の価値があることができますが彼らも、高価である必要はありません。

いくつかのヘッドフォンは、彼らはよく作られているので、高価な耐久性のあることを覚えておいてくださいと大きな音。他の人は、彼らが$だから高価なスタイリング、ブランド名、およびマーケティングの数百ドルの層の下に20台のヘッドホン。私はここspecficの勧告をすることはありませんが、私はあなたはそれがエレクトロニクスや音楽を専門にしても、大きな箱の店で良いヘッドフォンを見つけるのはそうじゃないと言うだろう。消費者のハイファイのすべての他の側面と同様に、あなたの研究(と買主の危険負担)を行います。
ロスレスフォーマット

これは、適切にエンコードされたのOggファイル(またはMP3、またはAACファイル)は、中程度のビットレートで、オリジナルと区別がつかないだろう十分な事実です。

しかし、ひどくエンコードされたファイルのでしょうか?

20年前、すべてのMP3エンコーダは、今日の基準で本当に悪かったです。これらの古い、悪いエンコーダが充実していますが、ライセンスは安いし、ほとんどの人が言うことができないか、とにかく違いを気にしないと思われるので、まだ使用されています。なぜ、どのような企業は、それが完全に気づいていないが壊れて何を修正するためにお金を使うのでしょうか?

以下のような新しいフォーマットへの移行のVorbisAAC、必ずしも助けにはなりません。例えば、多くの企業や個人が使用する(まだ使用)のFFmpegの超低品質は、内蔵のVorbisのエンコーダそれはFFmpegの中にデフォルトだったと、彼らはそれがいかに悪い知らなかったので。AACは広く展開され、低品質のエンコーダのにも長い歴史を持っています。すべての主流非可逆形式で行います。

以下のようなロスレスフォーマットFLAC [損傷オーディオ忠実度の可能性を回避23低品質の非可逆符号化部と、あるいは誤って使用され、良好なロッシーエンコーダによって]

ロスレス形式を配布するための第二の理由は、世代の損失を避けるためです。各再エンコードやトランスコードは、より多くのデータを失います。第1の符号化が透明であっても、第二は、可聴アーティファクトを持つことになり非常に可能です。これは、リミックスやダウンロードからサンプリングする場合があります誰にも重要。これは、特に私たちのコーデックの研究者にとって重要。我々はで動作するようにクリーンなオーディオを必要としています。
ベター・マスターズ

私は、以前のリンクBASテストは、記録のSACD版があることはさておきとして言及することができます CDのリリースよりも実質的に良好に聞こえます。それはないため、増加したサンプル・レートや深さが、SACDの高品質なマスターを使用しているためです。 CD-RへバウンスするとSACDを作るために使用された元のオーディオが優れていたので、SACD版はまだのように、元のSACDとして良いとCDのリリースよりも良いですね。グッド生産や音楽の最終的な品質に貢献明らかにマスタリング[ 24 ]

他の業界のラベルから、同様の取り組み「iTunesのためにマスタリング」の最近の報道は多少心強いです。何見られることを残るのはAppleと他の人が実際には「それを得る」または、これはまた別の消費者に販売するためのフックが過ぎている場合、音楽のより高価なコピーは、彼らがすでに所有しているか否かです。
囲む

別の可能な「販売フック」、私は熱狂的に自分自身に購入したい1は、サラウンド録音です。残念ながら、ここではいくつかの技術的な危険があります。

多くのチャンネル(5.17.1、など)を備えた古いスタイルディスクリートサラウンドは、1960年代の劇場に遡る技術的な遺物です。これは、競合システムよりも多くのチャンネルを使用して、非効率的です。サラウンドイメージが制限され、聴取者が着座又は位置からシフトするとき近いスピーカーに向かって崩壊する傾向があります。

私たちは、アンビソニックスのようなシステムで優れた堅牢な局在を表し、エンコードすることができます。問題が再現し、自然な音場のためにエンコードされた何かがステレオにミックスダウン時に悪い音、そして説得力のある方法で、人工的に作成することはできません両方という事実のための設備のコストです。それは一種の3D映像は、常に確実に病気の人口の動きの5%になり派手なギミックに退化しているようだかのような偽のアンビソニックスやホログラフィック、オーディオ、するのは難しいです。

バイノーラル音声も同様に困難です。それはすべての人に少し異なる動作をするので、あなたはそれをシミュレートすることはできません。これは、自己集合耳介のシステム、外耳道、および神経処理にチューニング学んだスキルだし、それは、任意の2つの個体においてまったく同じように組み立てることはありません。人々はまた、無意識のうちにローカライズを強化するために頭をシフトし、彼らがない限り、うまくローカライズすることはできません。つまり、固定サラウンドで範囲をためにできることが、バイノーラル録音でキャプチャすることができない何か。

これらは、ほとんど不可能な技術ハードルです。ディスクリートサラウンドは、市場で以下であることが証明された、と私は個人的に特にアンビソニックスが提供する可能性に興奮しています。
アウトロ

    「私はずっと音楽のためのケアをしたことはありません。
    これは、高忠実度です!」
    -Flanders&スワン、複製の歌

ポイントは右に、音楽を楽しんでいますか?現代の再生の忠実度は、一世代前既に利用可能な優れたアナログシステムよりも不可解優れています。ただ、他のよりも、それ以上の論理的極限である最初の世界の問題は?おそらく、悪いミックスとエンコーディングだがやる私を気に。彼らは音楽から私をそらす、と私はおそらく一人ではありませんよ。

なぜ192分の24に対してプッシュバック?それは故意の無知と詐欺行為の人々に基づいて、ビジネスモデルを存在しない問題を解決するためだからです。より多くのその疑似科学を広く世界に未チェックになり、難しくこれは小さく、比較的重要でない例であったとしても... truthinessを克服するための真実のためです。

    「私にとって、本当にしかし満足と安心、妄想に固執するよりも、あるとして宇宙を把握することがはるかに良いです。」
    -Carlセーガン

参考文献

読者は、私は自分の記事を開始する前に認識していなかったその優れた論文のペアに私を警告しています。彼らは私が詳細に行うのと同じポイントの多くに取り組みます。

    高品質のデジタルオーディオコーディングメリディアンオーディオのボブ・スチュアートでは、そのより大きな長さにもかかわらず、美しく簡潔です。私たちの結論は(やや広い周波数範囲とビット深度の必要性を与えられたとして、彼は非常に正当な理由なしにかかる)多少異なりますが、プレゼンテーションでは、はっきりと従うことは簡単です。[編集:私はミスタースチュアートの他の記事の多くに同意しないかもしれないが、私はこの1つ多くのことを好きです。]

    デジタルオーディオのサンプリング理論 LavryエンジニアリングのダンLavryにより、[更新リンク2012104]は、いくつかの読者が指摘した別の記事です。これは、より詳細な27ページの治療にサンプリング、オーバーサンプリング、およびフィルタリングについての私の2ページほどを展開します。グラフ、例および参考文献の多くがある、ない心配。

ステファン・ピジョンaudiocheck.netは、彼のウェブサイトで特色ブラウザベースのリスニングテストをプラグインする書きました。テストのセットはまだ比較的小さいですが、いくつかは、この記事の文脈では直接関係しました。彼らはよく働いたと私は品質が非常に良いことが判明しました。
脚注

    1枚のイライラポスターが書いたように、

        [サンプリング定理]は、それが他の方法で回避だ、どのようにデジタルオーディオ作品を説明するために考案されていません。あなたは定理を信じていない場合は、デジタルオーディオは、定理から発明された後、あなたはどちらかのデジタルオーディオを信じることができません!!

    http://www.head-fi.org/t/415361/24bit-vs-16bit-the-myth-exploded

    それが最も退屈なパーティーが今まで騙しなかった場合、それはかなり近かったです。

    これは、ナノメートルまたはオングストロームで測定波長として可視光の話をするより一般的なのです。私は音と一致するように周波数を使用しています。周波数は波長のちょうど逆であるとして彼らは、同等です。

    LEDの実験は、彼らが本当に紫外線じゃない主な理由は、「紫外線」のLEDでは動作しません。彼らは、蛍光の少しを引き起こすのに十分な深紫だが、彼らはよく目に見える範囲ではまだです。本物の紫外LEDは、どこにでも個々に$ 100- $ 1000の費用と、このテストに使用した場合、目の損傷を引き起こします。消費者のグレードではない、本当に-UV LEDも明るくするために、いくつかのかすかな白色光を発光するので、あなたは、発光ピークが本当に紫外線であっても、それらを見ることができると思います。

    この記事のオリジナルバージョンは、IR LED300-325THz(約920-980nm)、見えない波長で動作することを述べました。かなりの数の読者は、彼らが実際にはかろうじて彼らのリモコンの一部(または全部)にLEDを見ることができると言うことを書きました。いくつかは、私はこれらがあっリモコンどの知っているように親切だった、と私は分光計で、いくつかをテストすることができました。LOと見よ、これらのリモコンだけで可視範囲の極端なエッジと重なる、350-380THz800-850nm)で動作する、より高い周波数のLEDを使用しました。

    96kHzのサンプルを再生することができない多くのシステムは黙っ48kHzでのダウンサンプリングではなく、ファイルを再生することを拒否します。この場合、トーンはすべてで再生されず、再生に関係なくシステムがどのように非線形黙っていないでしょう。

    オーバーサンプリングは、信号処理における高いサンプリングレートのための唯一のアプリケーションではありません。いくつかの理論的な利点は、それが配布のためにダウンサンプリングされる場合でも、間引きをeschewing高いサンプリングレートで帯域制限オーディオを生産することにあります。ほとんどのプロコンソールの仕組みは企業秘密ですように、それは、実際に使用されているものがあれば明確ではありません。

    歴史的推論かどうか、彼らは間違っては20kHzを超えたコンテンツを保持することは良く聞こえることを前提としているため、多くの専門家は、今日は、消費者が同じように、高いレートを使用ことに疑いはありません。

    大音量の音楽をオフにした後の鼓膜「uncringing」の感覚はかなり本物です!

    :いくつかの素敵な図はHyperPhysicsサイトで見つけることができます
    http://hyperphysics.phy-astr.gsu.edu/hbase/sound/protect.html#c1

    20ÂμPaは、一般に、聴覚測定のために0デシベルであると定義されます。それは1kHzで聴覚の閾値にほぼ等しいです。耳は、しかし24kHzの間の8デシベルのようにはるかに敏感です。

    以下の論文は、私は全体の実行したディザの最良の説明があります。それは、画像のディザについてですが、前半は画像にその使用を拡張する前に、オーディオにディザの理論と実践を取り上げます。

    キャメロン・ニクラウスChristouの、画像処理に最適なシェーピングディザーとノイズ

    私自身のスマートアレック同胞の一つが行ったようにDSPエンジニアは、あなたがそれを抽出するために変換無限のフーリエ変換を使用することを許可している場合、16ビットオーディオは、純粋なトーンのための理論的には無限のダイナミックレンジを持っていることを、指摘すること。この概念は、電波天文学に非常に重要です。

    耳は、フーリエ変換とは異なり、完全ではない動作しますが、その分解能は比較的限られています。これは、16ビットオーディオ信号の最大の実用的な動的深さに制限を課します。

    生産はますます32ビット浮動小数点を使用して、両方のそれは最近のプロセッサ上で非常に便利なので、それは完全に未知の行くとミックスを台無しに任意の時点で、偶発的クリッピングの可能性を排除しているため。

    いくつかの読者は、超音波を可聴相互変調歪みを引き起こす可能性があれば、メイヤーとモラン2007テストがnullの結果を生産している可能性がどのように、知りたいと思っています。

    時々 '「常に」「意志」と同じではありませんと「可能」とことは言うまでもないです。超音波から相互変調歪みは、材料の所与のセットのための任意のシステムでは、可能性はなく、確実です。マイヤーとモランヌル結果は、相互変調歪みが彼らのテストの過程で使用されるシステムに聞こえないだったことを示しています。

    読者はに招待されている上記の単純な超音波相互変調歪みテストしてみてください、自分の機器の相互変調ポテンシャルの簡単なチェックのために。

    Karouと省吾、22kHzのトーン上のしきい値の検出(2001)。コンベンション紙5401は、2001512-15、アムステルダム、第110大会で発表しました。

    Griesinger、中心周波数とスピーカーの高周波相互変調歪みの知覚、および高品位オーディオとの関係

    [A]が、見つけることは全く驚いた[B]は代わりに確証バイアスがhooeyである「私は一度、結果を期待していくつかのヘッドフォン/アンプ/録音を聴い:出版以来、いくつかのコメンテーターは、[言い換え]同じ逸話の同様のバージョンで私に書きました!」

    私は2つの考えを提供します。

    まず、確証バイアスは誤った結果を持つすべての正しい結果に代わるものではありません。これは、未知の量によって制御されていないいくつかの方向に結果をスキュー。どのように正しいか間違って伝えることができることを確認のためのテストは、あなた自身の潜在意識によって装備されている場合?あなたは大きな違いを聞くと期待が、小さな違いを聞いてショックを受けたとしましょう。まったく違いは、実際に何がなかった場合は?または、多分あった、あなたの善意懐疑的な見方が過補償バイアス電位を意識し、差?それとも、あなたは完全に正しかったですか?このようABXとして客観テストは、すべてこの不確実性を排除します。

    第二に、「あなたは、あなたが偏っていないと思いますか?グレート!それを証明します!」客観テストの値は、自分自身の理解を通知する能力がないだけであるが、また他の人を説得します。クレームは証拠が必要です。臨時の請求は、特別な証明が必要です。

    ABXテストのために使用する最も簡単なツールは、おそらく以下のとおりです。

        foob​​ar2000のとABXプラグイン

        Squishyball、我々はXiph内で使用Linuxのコマンドラインツール

    水素オーディオでは、客観テスト要件が省略されTOS8を、それはサービスの面で第八項目だと。

    一般的に修復不可能な損傷に信号をリサンプリングするものとします。このケースではありません。一つのそのようなクリッピングを生じさせるものとして明らかミスをしない限り、ダウンサンプリングした後、アップサンプリングされた信号は、元から聴覚区別できないであろう。これは、より高いサンプリングレートが不必要なあることを確立するために使用される一般的なテストです。

    誰よりも速い光ニュートリノ厳密に関連したオーディオ、しかし...ではないかもしれませんか?

    ワイアード誌は、FLACなどのロスレスフォーマットは必ずしも完全にロスレスではないことを意味します:

        「いくつかの純粋主義者は完全にFLACSをスキップしてちょうどWAVファイルを購入することを教えてくれます。[...] WAVファイルを購入することで、あなたがファイルをFLACに圧縮されたときに生じる潜在的なデータの損失を防ぐことができます。このデータ損失はまれですが、それが起こります。」

    これは誤りです。 可逆圧縮プロセスは、どのような方法で、元のデータを変更したことがない、とFLACも例外ではありません。

    有線データファイルのハードウェアの破損に言及されたことをイベント(ディスク障害、記憶障害、黒点)では、FLACWAVは両方の影響を受けるだろう。FLACファイルは、しかし、チェックサムされ、破損を検出します。FLACファイルもWAVよりも小さく、影響を受ける可能性が少ないデータがありますので、そのランダムな破損が少ないだろう。

    「ラウドネス戦争は」それは一つだけではないのですが、今日の業界で悪いマスタリング実践の一般的引用例です。ラウドネスもWikipediaの記事を信じる読者をリードよりも古い現象です。早くも1950年代のように、アーティストやプロデューサーは、最大音量の可能な記録のためにプッシュ。機器ベンダーはますます研究し、熱く熱くマスターを可能にするために新技術を販売しました。 1970年代と1980年代に機器をマスター高度ビニルは、例えば、溝間隔が通常可能にするであろうよりも高い振幅を可能にするために、可能な場合、追跡およびネストされた溝の封筒。

    今日のデジタル技術は、ラウドネスが不条理レベルまでポンピングすることができました。また、彼らは仕事をしたり、彼らが本当に何をやっているかの幅広い理解せずにエン一斉に展開されている自動、非常に複雑な、独自のDAWのプラグインの茄多を提供しています。