TV会議用話者自動検出装置の開発
スポンサーリンク
概要
- 論文の詳細を見る
TV会議システムにおいて、話者の音声を検出して自動的に画面を切り替える高精度の話者自動検出装置を開発した。誤動作のない画面切り替えを実現するために、まず母音と無声摩擦音を検出し、それぞれの音韻の存在比率からファジィ推論を用いて会話音声と雑音とを判別する高精度の音声, 雑音判別方式を提案した。これにより会議中に予想される様々な雑音の除去率98.3%を達成した。また、隣接するマイクロホン間の相互相関から音の到達時間差を計算し、話者の位置を推定することにより、隣接話者間の誤検出を防止することが可能となった
- 社団法人電子情報通信学会の論文
- 1994-01-26
著者
-
則松 武志
松下電器産業マルチメディア開発センター
-
中藤 良久
松下電器産業(株)マルチメディア開発センター
-
則松 武志
松下電器・マルチメディア開発センター
-
中藤 良久
松下電器産業(株)マルチメディア開発センター:(現)信州大学大学院工学系研究科
-
北島 克美
松下通信工業
関連論文
- MPEG-4オーディオ低演算量帯域拡張方式とそのDSP実現(音響と音声処理・音声強調,ロバスト音声認識,一般)
- MPEG-4オーディオ低演算量帯域拡張方式とそのDSP実現(音響と音声処理・音声強調,ロバスト音声認識,一般)
- D-14-9 MPEG-4 オーディオ低演算量帯域拡張方式におけるエイリアシング削減技術
- D-14-8 MPEG-4 オーディオ標準化向け低演算量帯域拡張方式
- オーディオ符号化におけるMDCT係数の削減
- メルLPCケプストラムの耐雑音性の評価
- 音声認識におけるメルLPCケプストラムの評価
- 音声認識におけるメル線形予測分析法の評価
- オーディオ符号化におけるスペクトル包絡推定法の改良
- 応答文の切り替えがもたらすタスク達成時間短縮効果についての検討
- SDオーディオ用高速,高音質AACエンコーダー (特集「SDワールド」)
- スペクトル線形写像による帯域制限音声の広帯域化(音声情報処理 : 現状と将来技術論文特集)
- 線形写像による帯域制限音声の疑似広帯域化
- 線形写像による帯域制限音声の疑似広帯域化
- 帯域制限された音声における広帯域化法の比較
- 帯域拡大による広帯域音声の合成方法の検討
- 音韻認識における連続分布型HMMの教師なし話者適応 (応用音響に関する特集)
- TV会議用話者自動検出装置の開発
- D-14-15 MPEG-4標準TWINVQ楽音符号化のスケーラブル構成
- D-14-14 MPEG-4標準TWINVQ楽音符号化の基本設計
- スケーラブルTwinVQ楽音符号化
- 車載用単語音声認識装置
- 対数パワースペクトル領域での減算処理による乗法性歪みの除去
- 周波数伸縮を用いた話者正規化法の種々の年齢層話者に対する検討