音響信号処理特論 ビームフォーミングとスペクトル減算の...

23
Graduate School of Information Science, Nara Institute of Science and T Speech and Acoustics Processing Laboratory 音音音音音音音音 音音音音音音音音音音音音音音音音音音 音音音音音音音音音音音音音音音音音音音音音 音音音音音音音音音音音 猿猿 猿 猿猿猿猿猿猿 ()

Upload: biana

Post on 20-Jan-2016

66 views

Category:

Documents


0 download

DESCRIPTION

音響信号処理特論 ビームフォーミングとスペクトル減算の 統合手法におけるミュージカルノイズ発生量の 高次統計量に基づく解析. 猿渡 洋(奈良先端大). 背景. 雑音環境下における(ハンズフリー)音声通話,音声認識要求の高まり. 実環境における雑音抑圧手法 . 様々な雑音抑圧手法. 単一チャネル スペクトル減算, Wiener Filtering, etc ... マルチチャネル信号処理 マイクロホンアレー信号処理 単一チャネル雑音抑圧手法では利用できない空間情報を利用可能 マルチチャネル信号処理と非線形ポスト処理の組み合わせ - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: 音響信号処理特論 ビームフォーミングとスペクトル減算の 統合手法におけるミュージカルノイズ発生量の 高次統計量に基づく解析

Graduate School of Information Science, Nara Institute of Science and Technology

Speech and Acoustics ProcessingLaboratory

音響信号処理特論

ビームフォーミングとスペクトル減算の統合手法におけるミュージカルノイズ発生量の

高次統計量に基づく解析

猿渡 洋(奈良先端大)

Page 2: 音響信号処理特論 ビームフォーミングとスペクトル減算の 統合手法におけるミュージカルノイズ発生量の 高次統計量に基づく解析

背景

雑音環境下における(ハンズフリー)音声通話,音声認識要求の高まり

実環境における雑音抑圧手法 様々な雑音抑圧手法

単一チャネル► スペクトル減算, Wiener Filtering, etc ...

マルチチャネル信号処理► マイクロホンアレー信号処理► 単一チャネル雑音抑圧手法では利用できない空間情報を利用可能

マルチチャネル信号処理と非線形ポスト処理の組み合わせ マルチチャネル信号処理よりも更に高い雑音抑圧性能 非線形処理に伴う人工的な歪であるミュージカルノイズが発生

ミュージカルノイズの発生は利用者に不快感を与える

 できる限り発生を抑えたい

Page 3: 音響信号処理特論 ビームフォーミングとスペクトル減算の 統合手法におけるミュージカルノイズ発生量の 高次統計量に基づく解析

マイクロホンアレー信号処理と非線形ポスト処理の組み合わせの例

► 従来の ICA では取り扱いが難しい点音源で近似できない 拡散性の雑音を取り扱い可能► ブラインド処理► 非定常な雑音を取り扱い可能► 後段に SS を用いるため,ミュージカルノイズが問題

ハンズフリー音声認識を目的とした,雑音抑圧手法 独立成分分析 (ICA) で推定した雑音を, 遅延和アレー (DS) により目的音を強調した信号からスペクトル減算

DS( 目的音強調 )

ICA( 雑音推定 )

スペクトル減算

特徴

ブラインド空間的サブトラクションアレー

マイクロホンアレー信号処理と非線形ポスト処理の組み合わせ手法マイクロホンアレー信号処理と非線形ポスト処理の組み合わせ手法

Page 4: 音響信号処理特論 ビームフォーミングとスペクトル減算の 統合手法におけるミュージカルノイズ発生量の 高次統計量に基づく解析

背景

高次統計量を用いたミュージカルノイズ発生量の指標

人が感じるミュージカルノイズの発生

量処理後の尖度の変化

強い関連

ミュージカルノイズの発生量と尖度(4次統計量)の間の関連 [1]主観的なミュージカルノイズの発生量と強い相関があることを確認

ミュージカルノイズの発生をできる限り抑ミュージカルノイズの発生をできる限り抑えたいえたいミュージカルノイズの発生量に関する非線形処理のパラメータ最適化を行い

たい 音質劣化を抑えつつ,できる限り処理強度(雑音抑圧性能)をあげたい

ミュージカルノイズの発生量に関する定量的な尺度が無い ヒューリスティックにパラメータを決定する事が多くなる 対象となる信号が変わるたびにパラメータを決める必要性

[1] Yoshihisa Uemura, et al, Automatic Optimization Scheme of Spectral Subtraction based on musical noise assessment via higher-order statistics,‘’ IWAENC2008.

マイクロホンアレー信号処理と非線形処理の組み合わせ手法において,ミュージカルノイズの側面からも議論できるようにな

った

問題

Page 5: 音響信号処理特論 ビームフォーミングとスペクトル減算の 統合手法におけるミュージカルノイズ発生量の 高次統計量に基づく解析

スペクトル減算後の尖度解析

平均値 平均値

負になった成分は零成分として積み上がる

分布が零方向へ移動し元の分布形状が変化する

スペクトル減算前 スペクトル減算後

スペクトル減算後の p.d.f.

スペクトル減算は推定雑音の平均に,ある一定の減算係数を乗じて減算する. すなわち,パワースペクトル上で p.d.f. が下図のように変形される.

Page 6: 音響信号処理特論 ビームフォーミングとスペクトル減算の 統合手法におけるミュージカルノイズ発生量の 高次統計量に基づく解析

ミュージカルノイズの発生量を抑えるアレー信号処理と非線形処理の統合手法

チャネル毎スペクトル減算とアレー信号処理の組み合わせ [2]

チャネル毎にスペクトル減算を行った後,遅延和アレー (DS) を適用する(下図右) 雑音抑圧性能を損なわず,ミュージカルノイズの発生を抑制できる. 尖度に基づく解析の結果,ガウス性雑音に対しては理論的にも尖度を低減, すなわちミュージカルノイズを低減できることを示した.

Noise estimation by beamforming

DS SSSS

SS

Channel-wisenoise estimation

DS

従来良く見られる組み合わせ方(BF+SS)

検討している組み合わせ方(chSS+BF)

[2] 高橋他,”チャネル毎スペクトル減算を用いたマイクロホンアレー・ポスト処理における  ミュージカルノイズの低減 ,” 日本音響学会秋季研究発表会講演論文集, 2-8-17, pp.671—674,2008.

本発表では,この検討している構造 (chSS+BF) がガウス性雑音以外に対してもミュージカルノイズを低減できる事を示す

Page 7: 音響信号処理特論 ビームフォーミングとスペクトル減算の 統合手法におけるミュージカルノイズ発生量の 高次統計量に基づく解析

従来のスペクトル減算のつなぎ方(BF+SS)

Beamforming(Delay-and-Sum)

Noise estimation(ICA, NBF, ABF,...)

Spectralsubtraction

(SS)

ビームフォーミングの後ろに,スペクトル減算を接続

1. ビームフォーミング (DS) によりシングルチャネルの目的音強調信号を得る.2. 同時に,死角制御型ビームフォーマ (NBF) や,適応アレー, ICA を用いて シングルチャネルの雑音推定信号を得る.3. 最後に 1, 2 で得られた信号を基にスペクトル減算を行い雑音抑圧信号を得る.

処理手順

Page 8: 音響信号処理特論 ビームフォーミングとスペクトル減算の 統合手法におけるミュージカルノイズ発生量の 高次統計量に基づく解析

提案法:ミュージカルノイズを低減可能なスペクトル減算のつなぎ方 (chSS+BF)

Channel-wisenoise estimation

SS

SSDS

チャネル毎にスペクトル減算を行ってから,後段でビームフォーミング

処理手順1. チャネル毎に雑音推定を行う. ( この推定はたとえば, Single-input multiple-output ICA (SIMO-ICA) などで

行う )2. チャネル毎にスペクトル減算を行い,マルチチャネルの雑音抑圧信号を得

る.3. 2 で得られたマルチチャネルの信号に対して,ビームフォーミングを行う.この この SS SS の接続方法だと処理後の尖度を下げることが可能 の接続方法だと処理後の尖度を下げることが可能 (( 詳細は後詳細は後

述述 ))

処理後の尖度を BF+SS に比べて低減可能 ミュージカルノイズを低減可能

Page 9: 音響信号処理特論 ビームフォーミングとスペクトル減算の 統合手法におけるミュージカルノイズ発生量の 高次統計量に基づく解析

尖度に基づく解析の指針

解析の流れ1. まず,スペクトル減算および, DS によってどのくらい尖度が変化するか

を示す.2. 次に,上記の解析結果を基に, chSS+BF および BF+SS によってどのくらい尖度が 変化するかを示す.仮定する信号 J チャネルのマルチチャネル信号 xj ( j=1, ..., J) を考える. チャネル毎に独立かつ同一分布に従う (i.i.d.) 信号が入力されているとする. また,時間領域における入力信号が従う分布の確率密度関数 (p.d.f.) は 両側対称かつ平均ゼロとする.

 この仮定により, 1 次を除く奇数次モーメント / キュムラントはゼロになる.

また,入力信号はパワースペクトル上ではガンマ分布でモデリングできるとする.

これらの仮定は入力信号がガウス性であることを仮定しない すなわち実環境におけるほとんど全ての雑音を対象にできる

処理後の尖度の増加量が小さい=ミュージカルノイズの発生量が少ない ⇒ 尖度を基に解析を行い chSS+BF の尖度増加量が小さいことを示す

Page 10: 音響信号処理特論 ビームフォーミングとスペクトル減算の 統合手法におけるミュージカルノイズ発生量の 高次統計量に基づく解析

スペクトル減算後の尖度解析

スペクトル減算後の尖度

スペクトル減算後のは以下のように表現できる [3]

[3] Y. Uemura et al., “Automatic optimization scheme of spectral subtraction based on musical noise assessment via higher-order statistics,” Proc. of IWAENC 2008,

スペクトル減算後の尖度は

減算係数だけでなく,処理前の信号の統計的性質にも依存する.

スペクトル減算の減算係数を大きくすると尖度が上昇する 入力信号の分布の形状( α )により,処理後の尖度が異なる.

Page 11: 音響信号処理特論 ビームフォーミングとスペクトル減算の 統合手法におけるミュージカルノイズ発生量の 高次統計量に基づく解析

DS 後の信号の尖度解析

モーメントとキュムラントを用いて解析を進め, DS 後の尖度がどうなるか明らかにする.ここでは以下の性質と仮説を用いる.

キュムラントに関する和の性質

周波数領域におけるパワー領域信号は以下のように表現できる

ここで,実部,虚部が互いに i.i.d. な信号であると仮定すると,パワー領域信号は2つの i.i.d. な信号の 2 乗信号の和になるため,キュムラントの和の性質からパワー領域のキュムラントを求めることができる.

パワー領域信号

Page 12: 音響信号処理特論 ビームフォーミングとスペクトル減算の 統合手法におけるミュージカルノイズ発生量の 高次統計量に基づく解析

DS 後の尖度の解析手順

入力キュムラント

DS 後キュムラント

DS DS 後モーメント

DS 後 2 乗モーメント

DS 後 2 乗キュムラント

DS 後パワー領域キュムラント

DS 後パワー領域モーメント

DS 後パワー領域尖度

時間領域

2乗領域

パワー領域

以下のように,時間領域から 2乗領域を経て,パワー領域の尖度を求める

2乗領域へ

パワー領域へ

Page 13: 音響信号処理特論 ビームフォーミングとスペクトル減算の 統合手法におけるミュージカルノイズ発生量の 高次統計量に基づく解析

DS 後の尖度

DS 後のパワー領域モーメント

DS 後の尖度

ここで求めた DS 後の尖度は任意のキュムラントを設定でき

あらゆる雑音に適用可能

Page 14: 音響信号処理特論 ビームフォーミングとスペクトル減算の 統合手法におけるミュージカルノイズ発生量の 高次統計量に基づく解析

DS 処理前後における尖度の関係

導出した尖度により,以下のような DS の処理前後の尖度の関係が導かれる

ここで,尖度が 6 未満の信号は劣ガウシアン信号であり, 現実的な音響信号として存在することは稀であると考えられる. そこで入力信号の尖度が 6 以上であるとするとおおよそ,以下のように近似できる.

マイクロホンの数が増えるに従って尖度の低減量が増加する

= ミュージカルノイズの発生量が低減する

Page 15: 音響信号処理特論 ビームフォーミングとスペクトル減算の 統合手法におけるミュージカルノイズ発生量の 高次統計量に基づく解析

最終出力の尖度比較

BF+SS の最終出力の尖度

chSS+BF の最終出力の尖度

ここからは, BF+SS及び chSS+BF の最終出力の尖度を議論する.

これらの最終出力の尖度のどちらが小さいかを議論する

Page 16: 音響信号処理特論 ビームフォーミングとスペクトル減算の 統合手法におけるミュージカルノイズ発生量の 高次統計量に基づく解析

最終出力の尖度の比較

導出した BF+SS, chSS+BF の最終出力の尖度を比較するため,次の指標を用いる.

この D は出力尖度の二手法間での差を表している. D>0 であれば, chSS+BF が BF+SS に比べて小さい尖度の信号を  出力していることを示す.

比較指標

手順 様々な尖度の入力信号に対する上記指標を観察する. なお,スペクトル減算の減算係数は 2.0 で固定.

D>0 であれば, chSS+BF の方がミュージカルノイズを低減できている事を示す.

Page 17: 音響信号処理特論 ビームフォーミングとスペクトル減算の 統合手法におけるミュージカルノイズ発生量の 高次統計量に基づく解析

最終出力の尖度の比較 : 結果

chSS+BF は BF+SS に比べて様々な入力信号に対して尖度を低減できる 効果がある事が分かる

Gaussian Super Gaussian

非ガウス性の雑音に対しても chSS+BF はミュージカルノイズの発生量を低減できる.

Page 18: 音響信号処理特論 ビームフォーミングとスペクトル減算の 統合手法におけるミュージカルノイズ発生量の 高次統計量に基づく解析

実験結果:入力がガウス性雑音の場合

• 雑音抑圧量は同じまま,ミュージカルノイズの発生を抑圧できる雑音抑圧量は同じまま,ミュージカルノイズの発生を抑圧できる• 尖度変化量とミュージカルノイズ発生量の関係の正当性を示唆 尖度変化量とミュージカルノイズ発生量の関係の正当性を示唆 

残留雑音の量処理後の尖度の増加量

Page 19: 音響信号処理特論 ビームフォーミングとスペクトル減算の 統合手法におけるミュージカルノイズ発生量の 高次統計量に基づく解析

実験結果case2: BF+SS のフロアリング係数 >0

フロアリング係数によっては BF+SS も 提案 chSS+BF と 同じ尖度を達成できる. しかしながら,その場合雑音抑圧性能は劣化

Page 20: 音響信号処理特論 ビームフォーミングとスペクトル減算の 統合手法におけるミュージカルノイズ発生量の 高次統計量に基づく解析

主観評価実験 – 実験条件

サンプリング周波数 16 kHz

目的音声 10 発話 ( 男性 5 発話,女性 5 発話 )

マイクロホン素子数 8

雑音

白色雑音,実収録の駅雑音,音声の三種類の雑音を 36 個のラウドピーカから再生し収録したもの.            注:これらの雑音は実収録して

おり,              チャネル間相関を含む

提示方法 AB 法被験者数 男性 8 名

提示信号数雑音1種類につき 10 ペアの信号計 30 ペアの信号を提示

提示信号および被験者数

目的 chSS+BF と BF+SS で処理した信号のどちらがより ミュージカルノイズが少ないか主観的に評価する.

Page 21: 音響信号処理特論 ビームフォーミングとスペクトル減算の 統合手法におけるミュージカルノイズ発生量の 高次統計量に基づく解析

信号収録に使用した実験環境

Page 22: 音響信号処理特論 ビームフォーミングとスペクトル減算の 統合手法におけるミュージカルノイズ発生量の 高次統計量に基づく解析

主観評価実験 – 結果

どの雑音についても,提案 chSS+BF の方がミュージカルノイズが少ないという判断がなされている

Page 23: 音響信号処理特論 ビームフォーミングとスペクトル減算の 統合手法におけるミュージカルノイズ発生量の 高次統計量に基づく解析

まとめ

ミュージカルノイズを抑えるための線形処理と非線形処理の統合手法   として検討している chSS+BF について,ガウス性雑音以外の 雑音に対する挙動の解析を行った. その結果,ガウス性雑音以外の雑音に対しても効果がある事が 確認された.

今後の課題

チャネル間相関が存在する場合の理論的な解析 DS 以外のマイクロホンアレー信号処理の検討 スペクトル減算以外の非線形処理における検討