趣味人のブログ

Cogito, ergo sum. 我思う故に我あり.

耳介散乱効果フィルタ

本ドキュメントは耳介散乱効果フィルタの詳細を述べる.耳介散乱効果フィルタは,入力と耳介による散乱を表すインパルス応答を畳み込み出力し,上下及び前後の方向感を実現する.但し,従来のバイノーラルサウンドプロセッサと同様に,正面方向の距離感は殆ど得られない.このため,SoundObject では残響室による反射波を加える事によって,上下及び前後の距離感を実現している.本ドキュメントでは最後に耳介散乱効果フィルタの評価を示し,フィルタにより上下及び前後の方向感が得られ,反射波により明確な距離感が得られる事を明らかにする.

1. 耳介による散乱

音源に対する上下及び前後の方向感は,主に耳介 (耳たぶ) による散乱効果によって生じる事が知られている.平均的な耳介の長さはおおよそ 60mm 程度であるから,音速を345m/s とすると,耳介長を波長とする周波数は約 5,800Hz となる.よって耳介による散乱は数千Hz を越える可聴周波数で顕著となり,この帯域が上下及び前後の方向感の実現に重要となる.

SoundObject では,球散乱効果フィルタにより左右の距離感を,両耳間時間差,レベル差により方向感を実現しているが,これらからは上下及び前後方向の方向感は得られない.また,球散乱効果フィルタの指向特性は 3,000Hz 以上では変わらない.このため,SoundObject では,頭部による散乱は剛体球による散乱と耳介による散乱によって構成されると想定し,各々を独立な球散乱効果フィルタと耳介散乱効果フィルタによって実装している.

2. 耳介散乱効果フィルタ

耳介散乱効果フィルタは,入力と耳介による散乱を表すインパルス応答を畳み込み出力する.SoundObject の耳介インパルス応答は,公開されている頭部インパルス応答 (Head-Related Impulse Response: HRIR) データベースから派生している.以下,座標系は SOFA 規定に基づく.

方位角 φ = 0, 180 deg. における HRIR には,入射波の y 軸方向の成分に対する応答は含まれて居ないと見なせる.これら以外の方位角の場合, HRIR には y 軸方向の成分による応答が含まれるが,それは上下及び前後の方向感には無関係である.従って,SoundObject の耳介インパルス応答は,方位角 φ = 0, 180 deg. における HRIR データベースから抽出されている.また,この耳介インパルス応答は,他の方位角の場合にも適用されている.

方位角 φ = 0, 180 deg. のインパルス応答を他の方位角にも適用するために,Fig. 1 に示す通り,耳介散乱効果フィルタでは θp (−180, 180] deg. を x-z 平面と平行,かつ (0, a cos θo, 0) を通る平面における x軸から反時計周りに計測した,音源方向への仰角と定義する.

f:id:suzumushi0:20210807171734p:plain

Fig. 1: Elevation angle θp of pinna scattering effect filter.

3. 耳介インパルス応答

SoundObject の耳介インパルス応答は SADIE II データベース [1] の KU 100 及び KEMAR ダミーヘッドの HRIR,及び High-resolution HRTF data set [2] の KEMAR ダミーヘッドの HRIR から抽出されている.これらのデータベースから抽出した方位角 φ = 0, 180 deg.,サンプリング周波数 48KHz のインパルス応答を Fig. 2 に示す.横軸は時間,縦軸は θp,緑のグラデーションは高い値,赤は低い値を示す.

f:id:suzumushi0:20210807171931p:plain

Fig. 2: Examples of impulse responses whose azimuth angles φ = 0, 180 deg.

HRIR の測定結果は測定対象や測定方法,機材に高く依存するため,上記の応答も多様な結果を示している.しかし,特徴的なインパルス応答が連続した約 24 サンプルの間に集中する点が共通している.48KHz サンプリングで 24 サンプルの時間は 0.5ms であり,音速を 345m/s とすると,この間に音波は 173mm 伝搬する.耳介の長さはおおよそ 60mm 程度であるから,このサンプル数は,耳介による散乱を表すインパルス応答にとって十分であると思われる.

このため,48KHz サンプリングの場合,SoundObject の耳介インパルス応答は,HRIR から抽出された連続する 24 サンプルとしている.Fig 3. に [2] の HRIR データの 256 サンプルと 24 サンプルからから計算した周波数応答の比較を示す.ここで仰角 θp = 0 である.24 サンプルあれば周波数応答を十分に表す事ができる.

f:id:suzumushi0:20210807172058p:plain

Fig. 3: Examples frequency responses calculated from 256 and 24 samples.

4. 評  価

従来の畳み込みによるバイノーラルサウンドプロセッサと同様に,耳介散乱効果フィルタでは前方方向の距離感が殆ど得られない.このため,SoundObject では残響室による反射波を加える事によって,上下及び前後の距離感を実現している.

SoundObject は,直接波と反射波から成る合成波 (Combined waves),直接波 (Direct wave) から出力を選択できる.従って,これらの出力の比較により耳介散乱効果フィルタの評価ができる.以下のビデオに示す通り,直接波では,全ての方位角おいて上下及び前後の方向感が得られ,更に合成波では,より明確な距離感が得られる事が判る.


www.youtube.com

参考文献

[1] SADIE project, "SADIE II Database," University of York, EPSRC, June 2018.

www.york.ac.uk

[2] H. Braren and J. Fels, "A High-Resolution Head-Related Transfer Function Data Set and 3D-Scan of KEMAR," RWTH Aachen University, December 2020.

publications.rwth-aachen.de