cBlog

Tips for you.

標本化と量子化:サンプリング周波数、ビット深度と復元可能性

スポンサーリンク
※当ブログのAmazon、iTunes、サウンドハウス等のリンクはアフィリエイトを利用しています。

ディジタル化とは標本化かつ量子化のことだけど、この2つはよく混同される。以前、ハイレゾについて高サンプリング周波数の意義を(やや否定的に)書いた。

yaritakunai.hatenablog.com

すると、注釈の“量子化誤差を除けば”の部分をもって、原音の復元可能性を疑う意見が寄せられた。しかし、この注釈は標本化定理が謳っている条件を満たすように付けたものであり、原音を復元できるかどうかは量子化の部分にもかかっているのである。

そこで、追加の記事を書いた。

yaritakunai.hatenablog.com

のだが、いささか不親切であるので、信号のディジタル変換、そして復元について補足したい。

 

A/D変換、D/A変換の過程

A/D変換とD/A変換

上の図はA/D (Analog to Digital)変換とD/A (Digital to Analog)変換の過程を段階的に表したものである。オーディオインターフェイス等ではこのような処理が行われていると基本的には考えてよい。実際には、例えばホールド処理なんて行っていないと思う。また、DTMをやる上では、サンプリング周波数とビット深度の設定を除けば関与できるのはすべてディジタル領域の処理であるので、こんなこと覚えなくてよい。

図の説明はいらないでしょ…? いわゆる波形が、標本化器と量子化器でそれぞれ時間と振幅が離散化(とびとびの値に丸めること)されるということ。それと、ホールド回路とローパスフィルタでなめらかな(元の)波形に戻るということ。この2つを抑えていただければ。

 

標本化定理で、戻るのか戻らないのか

標本化定理による復元

上の図は標本化定理で元の波形を完全に復元する様子を表したものである。見ていただければわかると思うが、標本化定理に量子化は介在しない。つまり、厳密にはディジタルオーディオ等ディジタル信号に標本化定理は成り立たない。だから、あの注釈をつけた。かといって、嘘っぱちなどと理解すべきでない。ディジタル信号にはサンプリング周波数の半分未満の周波数成分しか含まれていないということだし、ビット深度が大きいなら他の要因と比べて復元可能性に大きく影響するということでもない。ただ、信号処理では量子化誤差による影響は比較的あまり研究されていないというのは否めないかなと。

図の説明に戻る。ホールド回路とローパスフィルタの出力にカッコ書きで「カクカク」「なめらか」と書いた。「カクカク」は階段状の波形として理解してほしい。カクカクだからといって離散振幅ではない。分解能は無限大だがサンプリングの結果として振幅が離散的となっているだけの話である。あと、理想とついているのはクロック揺れがないとかコンデンサの静電容量とか時定数とかローパスフィルタが完全に1、0の形かということ。

 

サンプリング周波数、ビット深度

以上を踏まえて我々が気をつけるべきことは何か。

サンプリング周波数は超音波が聞こえるのでなければ44.1 kHzで十分。A/D時のローパスフィルタの遮断漏れなど考えなくてよい。そんなことは今どきのオーディオインターフェイスが対処してくれている。ただ一つ。変換するな。実務上は48 kHz以上で納品し、CDは44.1 kHzに落とすといったことが行われているが、あれはDVD等映像系メディアが48 kHzなためで本来は好ましいことではない。非整数倍への変換は、サンプリング周波数を上げて、ローパスフィルタに掛けて、落とすといった処理を行うので音は劣化するからである。単に、44.1→48変換みたいな狂気の沙汰よりはるかにマシだよねってだけ。(でも、IRリバーブとかは高い方が現実に近い掛かりだったりするけどね。)

一方、ビット深度はできるだけ高くすべき。分解能(ダイナミックレンジ)が高く、余韻とか小さな音でも劣化しにくいから。ずっと変換せずに落とす時だけディザリングしてねぐらい。ただ、floatにはちょっと誤解がある。float > intというわけではない。プロジェクトをそのまま引き継ぎたいとき有効なぐらい。例えば、24bit intより32bit floatの方がダイナミックレンジでかく見えるけど、(実際には数dBしか)変わらない。だってミックス(足し算)したら小さい方の値の分解能意味ないし、D/Aに渡すときはintだし。考えてみてね。録音時クリッピングしないけど、floatは音がいいわけではない。

 

おわりに

勢いで書いたから粗いとこあるのでご指摘歓迎。(議論はめんどくさいときしないかも。)