研究外部資金による研究

 

外部資金や学内グループ研究資金による研究のまとめです.

2014〜2017年度】

研究課題名: 音声対話システムを対象とした雑音に頑健な話者までの距離推定の研究

研究資金名: 科学研究費補助金(基盤研究C)

課題番号: 26330211

期間: 平成26年度〜平成29年度(2014〜2017年度)

研究代表者: 實廣 貴敏

連携研究員:武田 一哉(名古屋大学大学院情報科学研究科 教授)

      鹿野 清宏(奈良先端科学技術大学院大学 名誉教授)

研究概要:

音声対話システムにおいて,周囲状況を把握する方法の一つとして,単一マイクロホンにおいて,音声そのものからその特性を推定・識別することで,発話者の口からマイクまでのおよその距離を推定する手法を提案する.距離ごとに収録された音声データをDeep Neural Network (DNN)の一種で学習する.使用時には,短時間に区切られた音声フレームをDNNに入力し,推定距離を出力する.全フレームで推定距離の多数決を行うことで1発話の推定距離を得る.0.2 mと5 mの音声識別実験では,約80%の識別率を得ることができた.

発表文献:

[1] 宮嶋 博, 布目 貴大, 實廣 貴敏, 武田 一哉, “Deep Belief Networkを用いた単一マイクロホンによる発話者までの距離推定,” 日本音響学会2018年春季研究発表会講演論文集, 1-Q-1, pp. 61-62, 2018年.

[2] 李津, 實廣貴敏, 武田一哉, “単一マイクロホン入力音声から音響モデルを用いた発話者との距離推定,” 愛知工科大学紀要, 第14巻, pp. 1—7, 2017年.


2011〜2013年度】

研究課題名: 音声対話システムにおける音に着目した周囲状況推定技術の研究

研究資金名: 科学研究費補助金(基盤研究C)

課題番号: 23500230

期間: 平成23年度〜平成25年度

研究代表者: 實廣 貴敏

連携研究員:武田 一哉(名古屋大学大学院情報科学研究科 教授)

研究概要:

音声対話システムにおいて,周囲の状況を考慮しつつ,ユーザ対応できるようにするため,まず,音声認識用に用いるマイクロホンにより,話者までのおよその距離推定を行う.音声対話システムでよく利用される単一マイクロフォンを前提とする.入力音声のスペクトル歪みを空間伝達関数とし,あらかじめ用意した距離別のテンプレートとの照合から位置を推定する.縦横10 mほどのややオープンなスペースにおいて,1 mごとの判定では6~7割程度の精度が得られた.また,音声対話システムの用途としては,正確な距離は不要であるため,近距離と遠距離を識別できればよい.そこで,近距離を1 mまで,遠距離を1 m以上として識別すると,7~8割の精度が得られた.

発表文献:

[1] 李津, 實廣貴敏, “音響モデルを用いた発話者までの距離推定,” 平成24年度 電気関係学会東海支部連合大会, I3-8, 2012.

[2] 李津, 實廣貴敏, 武田一哉, “単一マイクロホンによる音響モデルを用いた発話者までの距離推定,” 日本音響学会2013年春季研究発表会講演論文集, pp. 29-30, 2013.


2008〜2010年度】

研究課題名: 装着型および環境設置型マイクロホンを用いた実環境下での音声認識

研究資金名: 科学研究費補助金(基盤研究C)

課題番号: 20500177

期間: 平成20年度〜平成22年度

研究代表者: 實廣 貴敏

連携研究員: 小暮 潔(ATR知識科学研究所所長,金沢工業大学 教授)

研究概要:

 ATR 知識科学研究所 (ATR-KSL, 2004〜2009年) では E- Nightingale プロジェクト(EN)と称し, 病 院内での医療行為を支援する技術の研究を行っていた. そのひとつに音声認識による看護師の状況把握がある. 装着型小型端末を通じて各看護師により作業内容を録音してもらい, 音声認識を利用し, 各看護師の意図した行動に関する情報を得る. 雑音や発話スタイルなどの多くの問題で認識精度は高くない.我々はまず雑音抑圧に関して 検討を進め, 病院内で観測される定常雑音,突発性の雑音, 変動する雑音に対応するため,種々の雑音 モデルを用いた.しかし, そのために使用環境での長 時間の雑音データを必要とした.

 そこで,本研究では雑音を観測するために環境設 置型のマイクロホン(以下,環境マイク)を用い,音 声認識対象となる音声を収録する装着型マイクロホ ン(以下,装着マイク)と併用して,雑音抑圧を行 う. 図1に想定された例を示す.看護師に小型端末 に接続された装着マイクにより発話を録音してもらい, 無線 LAN を通じて音声認識エンジンへ音声デー タを送る. さらに, 環境マイクにより周囲雑音を録音し, そのデータを雑音抑圧に用いる. 環境マイクで観 測された音を雑音と見なし, 装着マイク入力のその成分を抑圧すれば, 定常雑音だけでなく, 変動する雑 音も抑圧できる. 装着マイクで収録される雑音とは必ずしも一致しないが, 距離が近ければ音量の調整 などで吸収できる可能性がある. なお, EN では赤外線通過センサを用いて, 部屋単位での看護師の位置特定を実現しており, 環境マイクの付近にいることは別の手段で検出できる.


1 想定された病院での状況

 提案方法は基本的に従来手法であるSpectral Subtraction (SS)法を応用したもので,環境マイク入力を雑音と仮定し,音声認識対象である装着マイク入力から環境マイク入力を周波数領域にて減算する.その時,各周波数binごとに重みをかけることで,空間特性を補正して用いる.これにより,リアルタイムに雑音を推定でき,変動する雑音を抑圧することが可能となる[1][2].

 また,この手法では,2種類の同期されていない録音装置からの入力を用いるため,基本的に雑音抑圧時には2つの入力を同期する必要がある.今回は2つの音声特徴量ベクトルのユークリッド距離を用い,自動で時刻同期を行う場合の性能を検討した[3][4].

 音声認識精度での評価では,SNRや雑音種類を変えて検討を行った.たいていの条件で,SS法と比較して10〜20%程度,誤り改善率が得られた.特に,非定常な雑音に対して効果があることが分かった.また,自動時刻同期を用いると,用いなかった場合に比べ,ほぼ同等か,若干良い精度が得られた.


発表文献:

[1] 實廣 貴敏, 小暮 潔, ``装着型および環境設置型マイクロホンを用いた音声認識のための雑音抑圧手法,'' 日本音響学会2009年春季研究発表会講演論文集, pp.151-152, Tokyo, Mar., 2009.

[2] 真野 雄大, “装着型および環境設置型マイクロホンを用いた雑音抑圧での自動アライメントの検討”, 愛知工科大学卒業研究, 2009.

[3] 五十右 準, “2種類のマイクを用いた雑音抑圧での自動アライメントにおける高精度化の検討”, 愛知工科大学卒業研究, 2010.

[4] 真野雄大, 五十右準, 實廣貴敏, 小暮 潔, ``2種類のマイクロホンを利用して自動同期しつつ雑音抑圧する手法,'' 日本音響学会2011年春季研究発表会講演論文集, pp.155-156, Tokyo, Mar., 2011.