音の位相の話。音楽制作において位相に対してそんなに神経質にならなくてもいいんじゃない?という一意見。
まず、ここでいう位相とは音響信号の位相スペクトルのこと。位相スペクトルとは、各周波数成分の進み/遅れの相対関係のこと。スペクトルアナライザでよく見る振幅スペクトル(各周波数成分の大きさ)の位相バージョン。言いたいのは単一チャンネルにおける位相特性はそれほど意味ないよということ。ステレオとかチャンネル間の位相差に意味がないと言っているわけではない。あれは定位の知覚に重要。同様に、スネアドラムのトップとボトムとかマルチマイク録音の位相についてでもない。一方、複数トラックのミックス時のような「似たような波形じゃない複数チャンネルのサミング」における位相については気にしすぎだとは言っている。EQとかで位相の「ずれ」「乱れ」「歪み」とか言われる位相変化も気にしすぎ。とは言いつつ、マスタリング時のEQは気にした方がいいかも。こうやって書いているとわかりづらいね。まとめる。
- 気にしすぎ説
- 単一チャンネルの位相特性
- ミックス時の位相干渉
- エフェクタによる位相変化
- 言及外
- 複数チャンネル間の位相差
- 収録時の空間位相
- マスタリング時の位相変化
この記事を書こうと思ったのは、学術的には音響信号の位相特性は聴覚上重要でないと古典的には言われているのに、音楽制作では位相位相言われていて「あれー?」と思ったから。言い出しっぺはよく知らないけどヘルムホルツという資料。
小林幸夫,小島直樹,人間の聴覚心理現象と位相の関係 〜MF現象における位相の影響〜
今日、音色に関する研究として位相情報が扱われる事は少ない。 それは、ヘルムホルツがその著書"Sensation of Tone"で 「楽音の音色はその成分音の振幅によって決まり、それら成分音間の位相には関係が無い」と述べて以来、位相は音色と関係が無いと考えられてきたためである。これにより人間の聴覚は位相に鈍感である事が通説となった。しかしながら、複合音の各成分音間の位相差を変えたとき、その位相差を人間は検知できるという結果も報告されている(1)。また、人間は位相の違いを音色の違いとして知覚しているとも報告されており、人間の位相知覚に関しては、定まった見解を得るには至っていない(2)。
知覚できるという報告も書かれているね。
これは、位相差は検知されないという意見もあり、(同様に)議論は決着していないという文献。
日本音響学会,Q: スピーカの位相特性が悪いと,どういう問題が起きますか?
音楽信号などのように様々な周波数を含んだ信号をスピーカに入力した場合,位相に周波数特性があると,入力波形と異なる波形の音波がスピーカから放射されます。このため音色に変化が生じる可能性があります。ただ,人間の耳は音を分析的に感受するため,位相差は検知されないという意見もあり,これに関しては議論がありまだ決着していません。
こちらは位相特性の知覚に関する研究。
本論文では軽視されがちな位相特性が狭帯域包絡線を通して音源情報として知覚されることを明らかにし、位相特性と音源情報知覚の関係について論ずる。
ということもあり、音の位相特性は全く知覚できないと言いたいわけではない。影響はどれほどの量なのか知っておこうよということ。簡単な聴覚テストもあるのでやってみてください。
あと、この記事は正しくないと言う人もいるだろうけど、基本的な理屈を言っているのだから個人の経験をどうぞ重視してください。
位相知覚実験(テスト)
次のうち、矩形波はどれでしょう?
他の2つはサイコロを振って出た目のぶん位相をずらしてある。正解は書かないので、個々にダウンロードしてDAW等で確認してください。
*
*
*
正直、違うことはわかるよね。あることに着目すればどれが矩形波かも当てられると思う。問題は、どれだけ違うか。そして、波形で音色はわかるか。上の波形は次のようになっている(順番は問題と変えてある)。
(ピーク値が違うのは音量でわからないようパワーを揃えてあるからです。)
気づいた違いは波形の歪みほどだっただろうか。私は、違いは小さいと思うよ。でも、エンジニア的には大きな違いかもしれない。重要なのは、あなたはどう思うか。ましてや、「狂った」音だとか「低音質」に聞こえるだろうか。
この位相変化が非常識なほどということも忘れないでほしい。周波数成分によっては、逆相とか最大300°とか違っている。もし位相変化がわずかだったら? レベルが小さかったら? 非持続音だったら? 楽曲中だったら? 気づく自信はあるだろうか。
スペアナで見ればわかるけど、振幅スペクトルは同じ。ヘルムホルツがああ言ったのもよくわかる。位相スペクトルを見てみよう。波形が変わっても振幅スペクトルが同じなら、音色の違いは小さく、変化するのは位相スペクトル。
※左から波形順(理論値)
逆の立場の意見も述べよう。この音は低音じゃない、と。確かに低音(55.125 Hz)はすぐわかる。
高音だと高々3528 Hzでもわかりづらい。
もう一つ。異なる波形の位相を比べる・合わせるなんてナンセンスだということ。square_shift1とか2の0°ってどこ? 右上がりにゼロクロスするところだとしよう。180°はどこになる? 右下がりにゼロクロスするところだとしても、右下がりのゼロクロスが遅れているのに右上がりのゼロクロスは進んでいる波形なんていくらでもある。さらに言えば、たとえ周期波形でもゼロクロスが1周期に2回とは限らない。
重箱の隅をつつくようなこと言ったけど、アタックを強調するために立ち上がりを合わせるのは有効かもしれない。音波は非定常信号だから継時的変化として知覚に影響する可能性はある。でも、それが最適解とは限らない。たぶん、基本波のゼロ位相を一致させた方がアタックのエネルギーは大きくなる。これも重箱の隅か。
波形で見ても打ち消し合っているかはわからない。同一周波数、逆相じゃない限り、周波数成分は残っている。厳密な話。人間が周波数領域で聞いているとしたら聴覚上も(振幅スペクトルが)残存しているはず。周波数が違う正弦波を打ち消すのって大変なのよ(フーリエ変換の基底)。
マスタリングで位相が重要なのは、おそらくだけど全帯域にみっちり詰まっているからかなと。人間の感覚って対数的だから、高域では周波数がけっこう違っていても感覚では近いので近傍周波数の振幅スペクトルに影響している可能性が考えられる。そうなると、位相を乱さないリニアフェイズEQが必要となってくる。
次回予告
リニアフェイズEQの伝達関数を測定しようかなと考えている。その中で「リニアフェイズ(線形位相)とは」「群遅延」「FIRとIIR(ちょっとだけ)」についても触れていこうと思う。
アップしました