音声認識率改善のための波形減算とスペクトル減算の併用による反射音除去法(雑音下音声処理)(第6回音声言語シンポジウム)
スポンサーリンク
概要
- 論文の詳細を見る
本稿では,反射音を含む音声から反射音を除去し音声認識率を向上させる手法について報告する.提案法では,反射音は遅延時間と減衰率という2つのパラメータで記述できると仮定している.これら2つのパラメータは,複数マイクロフォンで受音した信号の自己相関関数を用いて推定している.そじて,遅延波形の減算には,反射音を含む音声の音声・無音区間や摩擦音・撥音の識別を行い,本来無音であったと推定できる区間に対してはスペクトル減算を用いることで,反射音成分を十分に除去している.提案法は,部屋の特性や目的音声に対する事前知識を必要とすることなく処理を実行できる.提案法を用いることで,ライン入力で認識率100%の音声が認識率約80%に低下する無雑音環境において,反射音を含む音声の認識率が約8%向上することを確認した.
- 一般社団法人情報処理学会の論文
- 2004-12-20
著者
関連論文
- ピアノによる1オクターブの上下行長音階演奏に対する熟達度の自動評価
- 与えられたコード進行に基づくギター伴奏用ボサ・ノヴァ編曲システム(音楽情報処理システム)
- G-024 与えられたメロディーとコード進行に基づくギター用編曲システムの構築(G.音声・音楽)
- F_0とIOIに関する区間頻度と音高・音価テンプレートの整合に基づく自動採譜システム"Scorer-SOFT"
- 直交3軸7素子アレーを用いた音源の方向推定と強調
- 指文字呈示による言語野の賦活に関する実験的検討
- 多重タグ付き英語学習者コーパスの開発と英語能力自動測定への応用
- 英語コミュニケーション能力の自動測定技術の提案
- 感性共有に基づく協調的音楽鑑賞支援に関する研究
- 能・狂言と洋楽歌唱における母音の相違
- 日本の「声の音楽」の諸相 : 共通の歌詞を用いた邦・洋楽の歌唱表現法の比較の試み
- 単純混合モデルに基づいた周波数領域ブラインド音源分離
- パネルディスカッション : 作るだけでいいの?調べるだけでいいの?(合同特別企画)
- D-15-39 英語表現能力評価尺度の一検討(D-15. 教育工学,一般セッション)
- 英語学習者コーパスの開発と英語表現能力評価尺度の検討(ユビキタス学習環境/一般)
- 弾き易さを考慮したギター・コードフォーム列探索システム
- 近傍周波数ビンの連結による周波数領域ICAの提案(研究速報)
- 日本語における略語自動生成法の検討とその音声インタフェースへの応用(システム,第9回音声言語シンポジウム)
- 近傍周波数一括処理ICAによるブラインド音源分離の後処理としてのWienerフィルタの効果(音源分離/一般)
- D-15-31 英語音響モデルによる日本人英語能力判定手法の検討(D-15.教育工学,一般講演)
- D-15-25 日本人英語学習者による日英翻訳コーパスの開発(D-15.教育工学,一般講演)
- D-14-6 次世代情報家電への音声インタフェースの導入に関する検討(D-14.音声・聴覚,一般講演)
- 日本の「声の音楽」の諸相 : 共通の歌詞を用いた邦・洋楽の歌唱表現法の比較の試み
- 直交3軸7素子アレーを用いた音源の方向推定と強調
- Web上のテキスト情報と翻訳モデルを利用した翻訳品質評価法の検討(翻訳・多言語化)
- Web 上のテキスト情報と翻訳モデルを利用した翻訳品質評価法の検討
- WWW上のテキスト情報を利用した翻訳品質評価法の検討
- 機械学習を用いた発話スタイル依存音響モデル自動選択による対話音声認識
- 日本語における略語自動生成法の検討とその音声インタフェースへの応用(システム,第9回音声言語シンポジウム)
- 日本語における略語自動生成法の検討とその音声インタフェースへの応用(システム,第9回音声言語シンポジウム)
- 対訳コーパスを用いた翻訳品質自動評価法(音声言語情報処理とその応用)
- 対訳コーパスを用いた表層的類似度に基づく翻訳能力自動評価法
- 対訳コーパスを用いた表層的類似度に基づく翻訳能力自動評価法
- 対訳コーパスを用いた表層的類似度に基づく翻訳能力自動評価法
- 直交3軸7素子シリコンマイクアレーを用いた音源方向の推定精度(立体音響,一般)
- 基本周波数の変動による音韻性の向上について
- 終助詞「ね」の韻律による皮肉と賞賛の識別
- 皮肉音声の音響的特徴に基づいた識別の試み
- ニューラルネットワークと多素子超音波トランスデューサによる水中物体の3次元画像化
- 皮肉音声の音響的特徴に基づいた判別
- ニューラルネットワークと多素子超音波トランスデューサによる水中物体の画像化
- 写真画像からの自動楽曲生成(音響・超音波サブソサイエティ合同研究会)
- ギターにおけるコード列演奏の最適化に関する手法(音楽情報2)
- G-025 ギターコード演奏における最適押弦位置決定システム(G.音声・音楽)
- G-017 調内音としての適合性と機能的適合性に基づく調の判定(G.音声・音楽)
- TL2000-7 和声学学習過程における思考と感性の統合
- 指文字呈示による言語野の賦活に関する実験的検討
- 指文字呈示による言語野の賦活に関する実験的検討
- MEGによる電流源推定への適用を目的とした灰白質抽出手法の提案
- ポップス系の旋律に対する和声付与システム : AMOR(産学連携論文)
- ハミングによる単旋律の自動採譜(音楽情報2)
- ピアノをMIDIで駆動する際のノート・オン・タイミングの補正について(音楽情報2)
- G-016 ハミングからの階名と音価の推定(G.音声・音楽)
- 単旋律ギター演奏における最適押弦位置決定システムの構築
- 四声体和声の音楽美を評価するシステム"MAESTRO"
- 音楽美評価システム"MAES"の構築とその評価
- 和声学におけるバス課題についての回答確認システムの構築とその評価
- SP2000-36 調波構造音による先行音効果
- ET2000-26 和声学学習のためのバス課題実施システムのユーザインタフェースとその評価
- 既知雑音除去法の有効性に関する検討
- 皮肉発話における話者の心的状態と韻律の関係
- 周波数領域ICAの後処理としてWienerフィルタを用いた短時間混合音声の分離
- 吃音のモデルとその実験的検証
- 近傍周波数ビンの連結による周波数領域ICAの検討(第8回音声言語シンポジウム)
- 近傍周波数ビンの連結による周波数領域ICAの検討
- 近傍周波数ビンの連結による周波数領域ICAの検討(Session-4 一般(ポスターセッション),第8回音声言語シンポジウム)
- 近傍周波数ビンの連結による周波数領域ICAの検討(Session-4 一般(ポスターセッション),第8回音声言語シンポジウム)
- パーミュテーションフリーICAの動作解析
- ICAにおけるパーミュテーション問題の解決法の提案(聴覚・音声・言語とその障害,一般)
- 独立成分分析を用いたブラインド音源分離の実環境に対する有効性の検証
- 独立成分分析を用いたブラインド音源分離の実環境に対する有効性の検証
- 音声認識における吃音処理に関する検討
- Bairstow-Hitchcock法における初期値設定へのFFT利用の効果
- K-079 情報家電操作のためのマルチモーダル・インタフェースの可能性(K.ヒューマンコミュニケーション&インタラクション)
- G-004 次世代情報家電操作のための音声コマンド設計に関する主観評価実験(G.音声・音楽)
- 非同期遠隔環境における音声利用の協調学習支援に関する研究(同期・非同期協調支援)
- 感性共有による音楽学習を対象とした協調的学習環境の設計
- 中国語連続音声における声調パターンの変形現象とその規則性
- コミュニケーションロボットにおけるノンバーバル情報を用いた状況依存音声認識(セッション3)(インタラクション・メディア)
- 独立成分分析による瞬時混合信号の分離における分離程度の評価に関する検討(音響・超音波サブソサイエティ合同研究会)
- レイトレーシングを前処理として用いたイメージメソッドによる音場シミュレータ
- レイトレーシングを前処理として用いたイメージメソッドによる音場シミュレータ
- 幼児・児童・障害児における音声言語発達研究の方法論について
- 吃音モデルの提案とその実験的検証について
- 球面と円筒面を含む境界面によって囲まれた閉空間での音線経路の計算
- 球面と円筒面を含む境界面によって囲まれた閉空間での音線経路の計算
- NIRS信号に対する類似波形選択と特徴点整合を前処理とした独立成分分析(一般)
- 2重オーバーラップ処理による長時間インパルス応答と無限長信号のコンボリューション
- 2重オーバーラップ処理による長時間インパルス応答と無限長信号のコンボリューション
- A-005 長時間インパルス応答と無限長信号のコンボリューションのための2重オーバーラップ法(A.モデル・アルゴリズム・プログラミング)
- G-010 複数自己相関関数の多数決に基づいた遅延時間推定による反射音除去法(G.音声・音楽)
- 音大における情報処理教育と工学部情報系における音楽教育(音楽制作と情報処理の友好関係)
- ネットワークアクセス可能な機能的音声データベースシステムの概念設計
- 音楽に活用される情報処理技術(音楽制作と情報処理の友好関係)
- 大阪万博とシュトックハウゼンの思い出(音響学の温故知新)
- 音大における情報処理教育と工学部情報系における音楽教育
- G-015 雑音既知の条件における音声の調波構造を用いた雑音除去(G分野:音声・音楽)
- 音声認識率改善のための波形減算とスペクトル減算の併用による反射音除去法(雑音下音声処理)(第6回音声言語シンポジウム)
- 音声認識率改善のための波形減算とスペクトル減算の併用による反射音除去法(雑音下音声処理)(第6回音声言語シンポジウム)
- 音声認識率改善のための波形減算とスペクトル減算の併用による反射音除去法(雑音下音声処理)(第6回音声言語シンポジウム)