追い出される下位ビット
一部で話題のMQA(Master Quality Authenticated)
①時間軸制御:主に再生系のローパスフィルタ時定数によるインパルス応答の劣化を(エンコードで)抑える技術。
②オーディオオリガミ:ハイレゾファイルの圧縮伸長技術。圧縮状態でもPCMデータとして成立し、そのまま再生が可能。
という2つの技術の組み合わせで構成されているようです。
特に②のオーディオオリガミと呼ばれるハイレゾファイルの圧縮伸長について、
MQAエンコードされた48kHz/24bitのFLACファイルをそのままPCM変換で48kHz/24bitで再生できるし、そのPCMデータをMQAデコードすると、96kHz/24bit(シングルデコード)や、192kHz/24bit(フルデコード)のファイルが取り出せたり、
MQA-CDは普通のCDDAとしてPCM44.1kHz/16bitとして再生できるのに、MQAデコードすると、88.2kHz/24bit(シングルデコード)や、176.4kHz/24bit(フルデコード)のファイルが取り出せる。
つまり圧縮状態でもそのままPCMとして再生可能というあたりが、頭が固くなりつつある技術屋的に謎だったのですが、なんとなくわかってきました。
MQAエンコードを大雑把にいうと
・サンプリング周波数の1/4と1/2の周波数でデータを分離する。(3つに分割)
・それぞれ録音された音源の「実質的なノイズフロア」より低いレベルに相当するPCMの「下位ビットを削る」
・分離した高い方1/2の周波数のデータを圧縮して1/4から1/2の周波数のデータの削った下位ビット位置にはめ込む。
・圧縮データをはめ込んだ1/4から1/2の周波数のデータをさらに圧縮して、1/4の周波数までのデータの削った下位ビット位置にはめ込む。
・すると元のサンプリングレートの1/4に圧縮されたPCMファイルが出来上がる。
というもののようです。
ここで気になるのが「下位ビットを削る」という操作です。
下位ビットを削るというのは、言い方を変えると「量子化ビット数を減らす」=「レゾリューション(解像度)を下げる」にほかなりません。
当たり前ですが削ったデータは復元されません。
実際には削った下位ビットに圧縮された高域のデータやらマーカ信号などが入るので、ファイルとしての量子化ビット数に変化はなく、そのまま元の1/4周波数サンプリングのPCMとして再生した際の音としては、削った下位ビット以下にあった背景ノイズが、圧縮データで出来た(ほぼランダムな)ノイズに置き換わる事となります。
つまり、MQAエンコードされたデータの再生音は、MQAデコードしようがしなかろうが、元の量子化ビットより少ないビット深度の音しか再現されないことになります。
ただし、元が24bitファイルであれば、下位4~5bitを削ったところで100dB以上のDレンジを確保できることもあり、元々ノイズに埋まってる下位ビット
を有効活用して後方互換性と記録再生できるデータ領域の拡張をする方法としてはよく考えられたものと思います。
よくわからんのがこの技術を応用したMQA-CD。
CDは16bitファイルなので、下位4bitを削ると12bit、MQAデコード有無にかかわらず可聴域のDレンジは実質72dB程度しか再現できない事になります。(それより低いレベルの信号はノイズに置き換わる)
感覚のマジックで解像度の低い信号にディザノイズを乗せると解像度が上がったように感じる特性も利用しているとは言え、これってどうなんでしょうねぇ。。
個人的な実験で、サンプリング周波数の拡大より量子化ビット数の拡大の方が好結果を得られた経験からすると、CD(16bit)を超える解像度を維持できると思われる24bitファイルのMQAエンコードは効果を期待していいと考えますが、MQA-CDは12bitになっちゃうわけで、少々懐疑的に思えます。。
まあ、実物聞いてないのであくまで理屈上の話ですが。。