音響信号処理特論 ビームフォーミングとスペクトル減算の...
DESCRIPTION
音響信号処理特論 ビームフォーミングとスペクトル減算の 統合手法におけるミュージカルノイズ発生量の 高次統計量に基づく解析. 猿渡 洋(奈良先端大). 背景. 雑音環境下における(ハンズフリー)音声通話,音声認識要求の高まり. 実環境における雑音抑圧手法 . 様々な雑音抑圧手法. 単一チャネル スペクトル減算, Wiener Filtering, etc ... マルチチャネル信号処理 マイクロホンアレー信号処理 単一チャネル雑音抑圧手法では利用できない空間情報を利用可能 マルチチャネル信号処理と非線形ポスト処理の組み合わせ - PowerPoint PPT PresentationTRANSCRIPT
Graduate School of Information Science, Nara Institute of Science and Technology
Speech and Acoustics ProcessingLaboratory
音響信号処理特論
ビームフォーミングとスペクトル減算の統合手法におけるミュージカルノイズ発生量の
高次統計量に基づく解析
猿渡 洋(奈良先端大)
背景
雑音環境下における(ハンズフリー)音声通話,音声認識要求の高まり
実環境における雑音抑圧手法 様々な雑音抑圧手法
単一チャネル► スペクトル減算, Wiener Filtering, etc ...
マルチチャネル信号処理► マイクロホンアレー信号処理► 単一チャネル雑音抑圧手法では利用できない空間情報を利用可能
マルチチャネル信号処理と非線形ポスト処理の組み合わせ マルチチャネル信号処理よりも更に高い雑音抑圧性能 非線形処理に伴う人工的な歪であるミュージカルノイズが発生
ミュージカルノイズの発生は利用者に不快感を与える
できる限り発生を抑えたい
マイクロホンアレー信号処理と非線形ポスト処理の組み合わせの例
► 従来の ICA では取り扱いが難しい点音源で近似できない 拡散性の雑音を取り扱い可能► ブラインド処理► 非定常な雑音を取り扱い可能► 後段に SS を用いるため,ミュージカルノイズが問題
ハンズフリー音声認識を目的とした,雑音抑圧手法 独立成分分析 (ICA) で推定した雑音を, 遅延和アレー (DS) により目的音を強調した信号からスペクトル減算
DS( 目的音強調 )
ICA( 雑音推定 )
スペクトル減算
特徴
ブラインド空間的サブトラクションアレー
マイクロホンアレー信号処理と非線形ポスト処理の組み合わせ手法マイクロホンアレー信号処理と非線形ポスト処理の組み合わせ手法
背景
高次統計量を用いたミュージカルノイズ発生量の指標
人が感じるミュージカルノイズの発生
量処理後の尖度の変化
強い関連
ミュージカルノイズの発生量と尖度(4次統計量)の間の関連 [1]主観的なミュージカルノイズの発生量と強い相関があることを確認
ミュージカルノイズの発生をできる限り抑ミュージカルノイズの発生をできる限り抑えたいえたいミュージカルノイズの発生量に関する非線形処理のパラメータ最適化を行い
たい 音質劣化を抑えつつ,できる限り処理強度(雑音抑圧性能)をあげたい
ミュージカルノイズの発生量に関する定量的な尺度が無い ヒューリスティックにパラメータを決定する事が多くなる 対象となる信号が変わるたびにパラメータを決める必要性
[1] Yoshihisa Uemura, et al, Automatic Optimization Scheme of Spectral Subtraction based on musical noise assessment via higher-order statistics,‘’ IWAENC2008.
マイクロホンアレー信号処理と非線形処理の組み合わせ手法において,ミュージカルノイズの側面からも議論できるようにな
った
問題
スペクトル減算後の尖度解析
平均値 平均値
負になった成分は零成分として積み上がる
分布が零方向へ移動し元の分布形状が変化する
スペクトル減算前 スペクトル減算後
スペクトル減算後の p.d.f.
スペクトル減算は推定雑音の平均に,ある一定の減算係数を乗じて減算する. すなわち,パワースペクトル上で p.d.f. が下図のように変形される.
ミュージカルノイズの発生量を抑えるアレー信号処理と非線形処理の統合手法
チャネル毎スペクトル減算とアレー信号処理の組み合わせ [2]
チャネル毎にスペクトル減算を行った後,遅延和アレー (DS) を適用する(下図右) 雑音抑圧性能を損なわず,ミュージカルノイズの発生を抑制できる. 尖度に基づく解析の結果,ガウス性雑音に対しては理論的にも尖度を低減, すなわちミュージカルノイズを低減できることを示した.
Noise estimation by beamforming
DS SSSS
SS
Channel-wisenoise estimation
DS
従来良く見られる組み合わせ方(BF+SS)
検討している組み合わせ方(chSS+BF)
[2] 高橋他,”チャネル毎スペクトル減算を用いたマイクロホンアレー・ポスト処理における ミュージカルノイズの低減 ,” 日本音響学会秋季研究発表会講演論文集, 2-8-17, pp.671—674,2008.
本発表では,この検討している構造 (chSS+BF) がガウス性雑音以外に対してもミュージカルノイズを低減できる事を示す
従来のスペクトル減算のつなぎ方(BF+SS)
Beamforming(Delay-and-Sum)
Noise estimation(ICA, NBF, ABF,...)
Spectralsubtraction
(SS)
ビームフォーミングの後ろに,スペクトル減算を接続
1. ビームフォーミング (DS) によりシングルチャネルの目的音強調信号を得る.2. 同時に,死角制御型ビームフォーマ (NBF) や,適応アレー, ICA を用いて シングルチャネルの雑音推定信号を得る.3. 最後に 1, 2 で得られた信号を基にスペクトル減算を行い雑音抑圧信号を得る.
処理手順
提案法:ミュージカルノイズを低減可能なスペクトル減算のつなぎ方 (chSS+BF)
Channel-wisenoise estimation
SS
SSDS
チャネル毎にスペクトル減算を行ってから,後段でビームフォーミング
処理手順1. チャネル毎に雑音推定を行う. ( この推定はたとえば, Single-input multiple-output ICA (SIMO-ICA) などで
行う )2. チャネル毎にスペクトル減算を行い,マルチチャネルの雑音抑圧信号を得
る.3. 2 で得られたマルチチャネルの信号に対して,ビームフォーミングを行う.この この SS SS の接続方法だと処理後の尖度を下げることが可能 の接続方法だと処理後の尖度を下げることが可能 (( 詳細は後詳細は後
述述 ))
処理後の尖度を BF+SS に比べて低減可能 ミュージカルノイズを低減可能
尖度に基づく解析の指針
解析の流れ1. まず,スペクトル減算および, DS によってどのくらい尖度が変化するか
を示す.2. 次に,上記の解析結果を基に, chSS+BF および BF+SS によってどのくらい尖度が 変化するかを示す.仮定する信号 J チャネルのマルチチャネル信号 xj ( j=1, ..., J) を考える. チャネル毎に独立かつ同一分布に従う (i.i.d.) 信号が入力されているとする. また,時間領域における入力信号が従う分布の確率密度関数 (p.d.f.) は 両側対称かつ平均ゼロとする.
この仮定により, 1 次を除く奇数次モーメント / キュムラントはゼロになる.
また,入力信号はパワースペクトル上ではガンマ分布でモデリングできるとする.
これらの仮定は入力信号がガウス性であることを仮定しない すなわち実環境におけるほとんど全ての雑音を対象にできる
処理後の尖度の増加量が小さい=ミュージカルノイズの発生量が少ない ⇒ 尖度を基に解析を行い chSS+BF の尖度増加量が小さいことを示す
スペクトル減算後の尖度解析
スペクトル減算後の尖度
スペクトル減算後のは以下のように表現できる [3]
[3] Y. Uemura et al., “Automatic optimization scheme of spectral subtraction based on musical noise assessment via higher-order statistics,” Proc. of IWAENC 2008,
スペクトル減算後の尖度は
減算係数だけでなく,処理前の信号の統計的性質にも依存する.
スペクトル減算の減算係数を大きくすると尖度が上昇する 入力信号の分布の形状( α )により,処理後の尖度が異なる.
DS 後の信号の尖度解析
モーメントとキュムラントを用いて解析を進め, DS 後の尖度がどうなるか明らかにする.ここでは以下の性質と仮説を用いる.
キュムラントに関する和の性質
周波数領域におけるパワー領域信号は以下のように表現できる
ここで,実部,虚部が互いに i.i.d. な信号であると仮定すると,パワー領域信号は2つの i.i.d. な信号の 2 乗信号の和になるため,キュムラントの和の性質からパワー領域のキュムラントを求めることができる.
パワー領域信号
DS 後の尖度の解析手順
入力キュムラント
DS 後キュムラント
DS DS 後モーメント
DS 後 2 乗モーメント
DS 後 2 乗キュムラント
DS 後パワー領域キュムラント
DS 後パワー領域モーメント
DS 後パワー領域尖度
時間領域
2乗領域
パワー領域
以下のように,時間領域から 2乗領域を経て,パワー領域の尖度を求める
2乗領域へ
パワー領域へ
DS 後の尖度
DS 後のパワー領域モーメント
DS 後の尖度
ここで求めた DS 後の尖度は任意のキュムラントを設定でき
あらゆる雑音に適用可能
DS 処理前後における尖度の関係
導出した尖度により,以下のような DS の処理前後の尖度の関係が導かれる
ここで,尖度が 6 未満の信号は劣ガウシアン信号であり, 現実的な音響信号として存在することは稀であると考えられる. そこで入力信号の尖度が 6 以上であるとするとおおよそ,以下のように近似できる.
マイクロホンの数が増えるに従って尖度の低減量が増加する
= ミュージカルノイズの発生量が低減する
最終出力の尖度比較
BF+SS の最終出力の尖度
chSS+BF の最終出力の尖度
ここからは, BF+SS及び chSS+BF の最終出力の尖度を議論する.
これらの最終出力の尖度のどちらが小さいかを議論する
最終出力の尖度の比較
導出した BF+SS, chSS+BF の最終出力の尖度を比較するため,次の指標を用いる.
この D は出力尖度の二手法間での差を表している. D>0 であれば, chSS+BF が BF+SS に比べて小さい尖度の信号を 出力していることを示す.
比較指標
手順 様々な尖度の入力信号に対する上記指標を観察する. なお,スペクトル減算の減算係数は 2.0 で固定.
D>0 であれば, chSS+BF の方がミュージカルノイズを低減できている事を示す.
最終出力の尖度の比較 : 結果
chSS+BF は BF+SS に比べて様々な入力信号に対して尖度を低減できる 効果がある事が分かる
Gaussian Super Gaussian
非ガウス性の雑音に対しても chSS+BF はミュージカルノイズの発生量を低減できる.
実験結果:入力がガウス性雑音の場合
• 雑音抑圧量は同じまま,ミュージカルノイズの発生を抑圧できる雑音抑圧量は同じまま,ミュージカルノイズの発生を抑圧できる• 尖度変化量とミュージカルノイズ発生量の関係の正当性を示唆 尖度変化量とミュージカルノイズ発生量の関係の正当性を示唆
残留雑音の量処理後の尖度の増加量
悪
良
悪
良
実験結果case2: BF+SS のフロアリング係数 >0
フロアリング係数によっては BF+SS も 提案 chSS+BF と 同じ尖度を達成できる. しかしながら,その場合雑音抑圧性能は劣化
主観評価実験 – 実験条件
サンプリング周波数 16 kHz
目的音声 10 発話 ( 男性 5 発話,女性 5 発話 )
マイクロホン素子数 8
雑音
白色雑音,実収録の駅雑音,音声の三種類の雑音を 36 個のラウドピーカから再生し収録したもの. 注:これらの雑音は実収録して
おり, チャネル間相関を含む
提示方法 AB 法被験者数 男性 8 名
提示信号数雑音1種類につき 10 ペアの信号計 30 ペアの信号を提示
提示信号および被験者数
目的 chSS+BF と BF+SS で処理した信号のどちらがより ミュージカルノイズが少ないか主観的に評価する.
信号収録に使用した実験環境
主観評価実験 – 結果
どの雑音についても,提案 chSS+BF の方がミュージカルノイズが少ないという判断がなされている
まとめ
ミュージカルノイズを抑えるための線形処理と非線形処理の統合手法 として検討している chSS+BF について,ガウス性雑音以外の 雑音に対する挙動の解析を行った. その結果,ガウス性雑音以外の雑音に対しても効果がある事が 確認された.
今後の課題
チャネル間相関が存在する場合の理論的な解析 DS 以外のマイクロホンアレー信号処理の検討 スペクトル減算以外の非線形処理における検討