DAW内プラグイン・エフェクト使用時のプロジェクトS.R.設定に関する考察

前書き

DAWにて録音や作曲を開始するにあたり、プロジェクトのS.R.(サンプリング・レート)をどの程度に設定するかは毎回悩むところです。一般にS.R.が高いほど原音を損なうことなく高音質のマスターが制作できるとされていますが、トレード・オフとしてDAWが編集作業に要求するスペックも飛躍的に向上します。

しかし、最終的な媒体として主流であるＣＤが44.1kHzなのに、高いS.R.で編集を行うメリットは本当にあるのでしょうか？
また、扱うジャンルなど目指すサウンドの傾向によっては、S.R.の差異は無視できるのでしょうか？

結論から先に言いますと、DAW内で完結するミックス・マスタリングを行う場合、特に「サチュレータ、コンプレッサなど倍音の生じるエフェクトをDAW内で挿すと結構変わる」可能性があります。以下、プロジェクトのS.R.によってどのような変化が生じるのか…聞き手や再生環境によって感じ方が違うであろう出力音はこの際おいておくとして、スペクトラム表示により違いを考察してみたいと思います。

細かい手順を追うのが面倒な方は作業手順を飛ばしていただき、後のスペクトラム図をご覧いただいても結構です。

概要

同一ソース（スィープ信号を収録した44.1kHzファイル）を異なるS.R.設定のプロジェクトで読み込み、プラグイン・エフェクトによる処理を施したのち、44.1kHzのファイルに変換。次にこれらのスペクトラムを比較する。
つまり、最終的に比較するファイルはいずれも 44.1kHz という同じ器を持っています。

準備物

Cakewalk Sonar
Wavosaur (フリーの2trエディタ）

本稿で使用するプラグイン・エフェクトはなるべくSonar付属、あるいはフリーの物に限定し、どなたでも再現できるようにプリセットを呼び出したママの設定を使用しています。
他のDAWでも同趣旨の実験は可能なはずです。

手順

手順の概要

スィープを作成して44.1kHzのファイルに保存
上記ファイルをS.R.設定の異なる複数のプロジェクトで読み込む
(読み込み時にファイルはプロジェクトのS.R.に変換される)
エフェクトを適用
44.1kHzのファイルに出力

手順の詳細

Wavosaur にて

新規ファイル作成(1ch/44,100/32bit float/10sec.)
スィープ作成(Tooks->Synthesis->Frequency Seep->Linear)
スィープ末尾をほんの少しフェードアウト（スピーカ保護のため）
ファイル末尾に5秒の空白を付加（のちに通すリバーブなどのテイル分余白）
ファイルを保存

Sonar にて

S.R.の異なる複数のプロジェクトを作成
先ほど作成したスィープを各プロジェクトに読み込む
(44.1kHz以外のプロジェクトでは、ファイルはすべて自動的にアップ・コンバートされる）
任意のエフェクトを挿入（パラメータは各プロジェクトで揃える）
プロジェクトをwavファイルに出力(mono/44100/32bit float)

Wavosaurにて

手順.9で出力したファイルを読み込む
ソノグラム表示（Tools->Sonogram、あるいはキーボードの「G」キー)

結果①

上段：44.1kHzのスィープ（今後、編集する元となる素材）
下段：上記を88.1kHzのプロジェクトに読み込み、一旦S.R.変換されたのち44.1kHz として出力

まずは、プロジェクトによるS.R.変換だけでは目だった差異がないことを確認します。
スペクトラムを見る限りでは、区別がつきません。

Bootsy FerricTDS挿入（プリセット「Classic Tape」)

Bootsy Ferric TDS Classic Tape. 44.1kHzプロジェクト

Bootsy Ferric TDS Classic Tape. 88.2kHzプロジェクト

上段から、44.1kHz、88.2kHzプロジェクト

スペクトラムを見る限り、少なくとも5つの高次倍音が付加されています。
いずれも途中から、原音とは逆に周波数の下降する信号が生じていますが、44.1kHzプロジェクトの方では、22kHz（プロジェクトS.R.の半分）を越えた周波数から順に折り返しているのがはっきり見えます。

Cakewalk Tube Leveler挿入(プリセット「Mix Warmer」)

上段から順に、44.1kHz、88.2kHz、192kHzプロジェクト。

エフェクトの設計と思われますが、2kHzまでの入力に対しては反応がありません。
それを越える入力に対しては多数の高次倍音が付加されています。
先ほどと同様、プロジェクトS.R.の半分から周波数が折り返しています。

考察

デジタル信号処理時、エイリアシング（折り返し）という現象により、S.R.の半分を越える入力信は、実際の周波数からS.R./2を引いた信号として認識されます。

44kHzのプロジェクトを例にとります。
プラグイン・エフェクトなどにより33kHzの倍音が発生するとします。これは本来なら可聴域外ですが33,000 – (44,100 / 2) = 11kHz という、可聴域「内」の信号が、いわば捏造されることになります。

ならば22kHzを越える周波数はフィルターすればよさそうに思われますが、デジタル領域においては、フィルターを適用しようにも、そもそも22kHzを越える周波数と、折り返して生じた信号の見分けがつきません。

次に、192kHzのプロジェクトを例にとると、96kHz以下の周波数については、この折り返し現象がおきません。この領域で存分に倍音を付加してから最終的に音声を44.1kHzに変換する直前に22kHzのローパス・フィルタを通した場合と、はじめから44.1kHz設定のプロジェクトで倍音を付加するのでは、先述のように「捏造」される信号量に差が生じます。

以下、私見ながら…
ロックなど歪みの多い音楽ジャンルに対して、音のクリーンさは必要でないからS.R.設定は44.1kHzで十分との声をよく聞きます。一旦レコーダに収録したのち、トラックをパラ出ししてミックスをアナログ卓で行う場合はその通り44.1kHzで十分かも知れません知れません。
逆に、ミックスをDAW内で完結させる場合、音圧を出すためにと全トラックにサチュレータ系のエフェクト挿入すると、デジタル由来の折り返しを相当な量、付加することになります。これが一般にDAW完結ミックスの音が「デジタル臭い」と言われる原因かも知れません。

サチュレータやコンプレッサーなど、倍音が付加される前提のエフェクト処理を行う場面が多いほど、高いS.R.で作業を行うメリットがあると言えるでしょう。

以下に、もういくつかの例を。

結果②

Cakewalk VX64挿入(プリセット「Heavy Distortion」)

上段から順に、44.1kHz、88.2kHz、192kHzプロジェクト。

前述のTube Levelerが2kHz以上の入力に作用していたのに対し、こちらはより低い周波数の入力にも倍音を付加しています。いずれも原音と比べると非常に多くの高次倍音が付加されていますが、特に44.1Khzプロジェクトでは高いレベルの折り返しが目立っています。

Native Instruments Guitar Rig4挿入(プリセット「Jimi's white pleasure」)

Native Instruments Guitar Rig 4 44.1kHzプロジェクト

Native Instruments Guitar Rig 4 88.2kHzプロジェクト

Native Instruments Guitar Rig 4 192kHzプロジェクト

上段から順に、44.1kHz、88.2kHz、192kHzプロジェクト。

ギター用のディストーション・エフェクトの例です。「歪み＝ノイズ」との解釈は可能ですが、エイリアシングによって生じる、原音と相関のある、しかし不自然な信号の捏造は、いわゆる「アナログっぽさ」を損なう原因の一つかも知れません。

Bootsy TesslaPro挿入(プリセット「Drive Max and Bass On」)

上段から順に、44.1kHz、88.2kHzプロジェクト。

88.2kHzのプロジェクトでも結構な折り返しが目立ちますが、44.1kHzプロジェクトで作成したファイルに比べると少ないです。

IK Multimedia T-Racks3 / Model670 挿入(プリセット「Warm670」)

IK Multimedia T-Racks3 Model670 44.1kHzプロジェクト

IK Multimedia T-Racks3 Model670 88.2kHzプロジェクト

上段から順に、44.1kHz、88.2kHzプロジェクト。

本稿の現象がプラグイン・メーカを問わないことを確認するため、異なる製品を試してみます。ただし、T-Racks3 Deluxeには内部オーバー・サンプリング(折り返しを回避する目的で、プラグイン内部で高S.R.に変換してから処理する）機能がありますので、そちらを有効にすれば結果も異なると思われます。

Cakewalk VX64 (「Sugary Sweet」) → IK Multimedia CSR (「Thick Vocal Plate」)挿入

Cakewalk VX64→IK Multimedia CSR 44.1kHzプロジェクト

Cakewalk VX64→IK Multimedia CSR 88.2kHzプロジェクト

Cakewalk VX64→IK Multimedia CSR 192kHzプロジェクト

上段から順に、44.1kHz、88.2kHz、192kHzプロジェクト。

サチュレータの後にリバーブを通す、ボーカル・トラックでは日常的に使用されるエフェクト・チェーンの例です。リバーブはいわばディレイの集合ですので、すべての入力信号が尾を引きます。折り返しにより「捏造」された信号も例外ではありません。

UAD2 (“Input” ゲイン高めに設定。保存したプリセットを両プロジェクトに使用)挿入

上段から順に、44.1kHz、192kHzプロジェクト。

Studer A800をはじめ、UAD2プラグインの一部は、信号を192kHzに内部変換した上で処理しているようです。確かに44.1kHzプロジェクト作業時の折り返しは他社製品よりずっと少なめですが、UAD内部でダウンコンバートする際のローパスフィルタが高めに設定されているためか若干折り返しが生じ、結果は同一ではありませんでした。

おまけ

Cakewalk付属のディザリングによるノイズの違い

Triangular Sonar Dither Rectangular

Rectangular Sonar Dither Pow-r1

Pow-r1

Pow-r2

Pow-r3

Rectangular、Triangularは、スペクトラムにほとんど違いはなく、いずれもノイズが均一に分布しているように見えます。Pow-r1, Pow-r2, Pow-r3は、それぞれノイズが特定の帯域に偏る特徴があります。また、Pow-r2, Pow-r3は無音部分のノイズが減る傾向にあるようです。

Pow系はいずれも高めの帯域にノイズを追いやるためか、楽器のルート音と干渉せず比較的クリーンとされますが、ディザリングを繰り返し行う予定がある場合は累積ノイズが偏重するため、最終段にのみ使用することが推奨されています。