雑音除去音声に対する特徴量抽出とMLLR適応の統合による雑音に頑健な音声認識
スポンサーリンク
概要
- 論文の詳細を見る
本研究では, 我々がこれまでに提案した雑音に頑健な音声認識手法(カルマンフィルタによる音声信号推定法と繰り返し教師無しMLLR適応の併用)に加えて, 頑健な特徴量を導入することについて検討を行った.雑音に頑健な特徴量として, Root Cepstrum係数を用いており, 音声認識に従来用いられてきたMFCCとの音声認識結果の比較を行った.また, 本研究では, MLLR適応を行う際の音素クラスタ数の選択についても検討を行った.提案手法の評価は, 3種類の音楽が重畳した音声を用いた大語彙連続音声認識により行っており, 提案手法により単語正解精度の改善が得られた.
- 一般社団法人情報処理学会の論文
- 2001-12-20
著者
関連論文
- 音響・言語モデルの適応処理によるスポーツ実況中継の音声認識(音声,聴覚)
- 音響・言語適応処理を用いたスポーツ実況中継音声の認識 : ハイライトシーン検出への応用
- SLP雑音下音声認識評価WG活動報告 : 評価用データと評価手法について(Session-6 スペシャルセッション: 共通コーパスを利用した耐雑音技術評価, 第7回音声言語シンポジウム)
- 実走行車内単語音声データベースCENSREC-3と共通評価環境の構築
- CENSREC-3 : 実走行車内単語音声データベースと評価環境の構築(ポスターセッション)(第6回音声言語シンポジウム)
- 実環境下音声認識の評価の標準化とその動向(音声・言語における標準化動向)(第6回音声言語シンポジウム)
- キーワードスポッティングによる商品紹介映像の商品区間への分割方法の検討
- マルチモーダルインタラクションによるニュース映像中の人物認識(システム論文特集号)
- CENSREC-2 : 実走行車内における連続数字音声データベースと評価環境の構築
- 自動車内における連続数字音声コーパスCENSREC-2の設計と評価(Session-7 スペシャルセッション(ポスター): 共通コーパスを利用した耐雑音技術評価, 第7回音声言語シンポジウム)
- Switching dynamical systemとパーティクルフィルタを用いた非定常雑音の逐次推定(Session-1 音響モデル・特徴量・学習, 第7回音声言語シンポジウム)
- 自動車内における連続数字音声コーパスCENSREC-2の設計と評価(Session-7 スペシャルセッション(ポスター): 共通コーパスを利用した耐雑音技術評価, 第7回音声言語シンポジウム)
- SLP雑音下音声認識評価WG活動報告 : 評価用データと評価手法について(Session-6 スペシャルセッション: 共通コーパスを利用した耐雑音技術評価, 第7回音声言語シンポジウム)
- 自動車内における連続数字音声コーパスCENSREC-2の設計と評価(Session-7 スペシャルセッション(ポスター): 共通コーパスを利用した耐雑音技術評価, 第7回音声言語シンポジウム)
- SLP雑音下音声認識評価WG活動報告 : 評価用データと評価手法について(Session-6 スペシャルセッション: 共通コーパスを利用した耐雑音技術評価, 第7回音声言語シンポジウム)
- Switching dynamical systemとパーティクルフィルタを用いた非定常雑音の逐次推定(Session-1 音響モデル・特徴量・学習, 第7回音声言語シンポジウム)
- Switching dynamical systemとパーティクルフィルタを用いた非定常雑音の逐次推定(Session-1 音響モデル・特徴量・学習, 第7回音声言語シンポジウム)
- K-60 ニュース映像に対する発話内容と人物問い合わせシステム(ヒューマンインタフェース(HI)3,K.ヒューマンコミュニケーション&インタラクション)
- 音声情報と画像情報の併用による商品紹介映像のセグメンテーション(音声,聴覚)
- GMMとEMアルゴリズムを用いた加法性雑音及び乗法性ひずみの抑圧(音声, 聴覚)
- GMMに基づく音声信号推定法と時間領域SVDに基づく音声強調法の併用による雑音下音声認識(音声, 聴覚情報論的学習理論論文)
- GMMとEMアルゴリズムを用いた加法性雑音及び乗法性歪みの抑圧(耐雑音)(第5回音声言語シンポジウム)
- GMMとEMアルゴリズムを用いた加法性雑音及び乗法性歪みの抑圧(第5回音声言語シンポジウム : 耐雑音)
- GMMとEMアルゴリズムを用いた加法性雑音及び乗法性歪みの抑圧(第5回音声言語シンポジウム : 耐雑音)
- GMMに基づく音声信号推定法の改良と実走行車内音声による評価
- 野球中継のハイライトシーン実時間配信を目的としたPCシーンの自動検出(映像・マルチメディアとパターン認識・理解)
- 野球中継のハイライトシーン実時間配信を目的としたPCシーンの自動検出(映像・マルチメディアとパターン認識・理解)
- 野球中継のハイライトシーン実時間配信を目的としたPCシーンの自動検出(映像・マルチメディアとパターン認識・理解)
- 音声認識を用いたスポーツ実況中継におけるハイライトシーン検出
- 雑音に頑健な音声認識のための時間領域SVDとGMMに基づく音声信号推定法の統合
- 時間領域SVDとGMMに基づく音声信号推定法の統合による雑音下音声認識
- GMMに基づく音声信号推定法を用いた雑音下音声認識
- GMMに基づく音声信号推定法を用いた雑音下音声認識
- GMMに基づく音声信号推定法を用いた雑音下音声認識
- 自動拡張辞書を用いたキーワードスポッティングによる音声対話型情報検索
- 基板検査用治具設計のための微細画像処理システムの開発
- ニュース映像における記事切り出しのカット点検出への依存性
- 音声認識と文字認識の統合に基づく商品紹介ビデオの区間分割と索引付け
- D-14-14 音声情報と画像情報の統合による商品紹介映像の商品区間への分割方法
- CENSREC-3 : 実走行車内単語音声データベースと評価環境の構築(ポスターセッション)(第6回音声言語シンポジウム)
- 実環境下音声認識の評価の標準化とその動向(音声・言語における標準化動向)(第6回音声言語シンポジウム)
- CENSREC-3 : 実走行車内単語音声データベースと評価環境の構築(ポスターセッション)(第6回音声言語シンポジウム)
- 実環境下音声認識の評価の標準化とその動向(音声・言語における標準化動向)(第6回音声言語シンポジウム)
- 単語・音素事後確率によるデコーディングに基づく音響モデルの教師なし適応化
- ユーザー発話のセグメンテーションと発話評価機能をもつ英語学習支援システム
- ユーザー発話のセグメンテーションと発話評価機能をもつ英語学習支援システム
- 音素事後確率に基づく信頼度を用いた音響モデルの教師なし適応化
- 雑音除去とモデル適応を併用した雑音下音声認識 : AURORA2タスクでの評価
- マイクロフォンアレイとカルマンフィルタを用いたノイズロバストなハンズフリー音声認識の検討
- マイクロフォンアレイとカルマンフィルタを用いたノイズロバストなハンズフリー音声認識の検討
- カルマンフィルタに基づく音声信号推定法を用いた雑音環境下での音声確認
- マルチモーダルインタラクションによるニュース映像中の人物認識と検索 (テーマ:一般)
- 雑音除去音声に対する特徴量抽出とMLLR適応の統合による雑音に頑健な音声認識
- 雑音除去音声に対する特徴量抽出とMLLR適応の統合による雑音に頑健な音声認識
- 雑音除去音声に対する特徴量抽出とMLLR適応の統合による雑音に頑健な音声認識
- モデル適応と雑音除去の併用による非定常雑音下での音声認識
- カルマンフィルタと繰り返しMLLR適応を用いた非定常雑音下での音声認識
- 部分空間と混合分布モデルを用いた声質変換
- 非定常雑音下での連続音声認識を目的とした音声信号の時間推移の推定に基づく雑音除去法の検討
- テロップ文字認識に基づく商品紹介ビデオの区間分割 (セッション1 2次元画像技術と応用)
- 音声の時間変化モデルに基づく音声信号指定法を用いた非定常雑音下での音声認識
- 音声の時間変化モデルに基づく音声信号推定法を用いた非定常雑音下での音声認識
- 音声の時間変化モデルに基づく音声信号指定法を用いた非定常雑音下での音声認識
- 雑音の時間変動を考慮にいれた雑音除去法の検討
- パーティクルフィルタとPolyak Averagingを用いた非定常雑音の抑圧(耐雑音)
- 部分空間射影の類似度による顔領域の追跡
- 部分空間射影による顔領域の追跡と学習
- 文字らしさを表す複数の部分空間を用いた手書き文字の切り出しと認識
- 複数の部分空間による手書き文字の切り出しと認識
- 動画像におけるアフィン変換を用いたカメラワークの正規化
- 講義音声を対象としたトピックセグメンテーションの検討
- テロップ区間と音声ディクテーションから導かれる単語空間の学習方式の検討 : トピックセグメンテーションへの応用
- 音声ディクテーションの誤りを考慮した検索方式の検討
- ニュース音声に対する教師なしトピックセグメンテーションにおける単語重要度決定方法の比較
- 顔認識における修正CLAFIC法の提案
- 修正CLAFIC法による顔認識と話者認識の統合
- 部分空間法による顔のサーチと認識
- 実環境下での話者認識におけるPMC法の効果について
- IE2000-32 / PRMU2000-57 / MVE2000-61 映像の時空間分割とネットワーク表現による動物体抽出システムの検討
- 分割テンプレートを用いた正規化相関法によるサッカー映像中のボールと選手の追跡
- 日本語 ・ 英語HMMを用いた発声評価と単語発声の誤り検出
- 雑音環境下での音声認識を目的とした高速カルマンフィルタによる雑音除去法の提案
- カルマンフィルタによる雑音除去法を用いた雑音環境下での音声認識
- カルマンフィルタによる雑音除去法を用いた雑音環境下での音声認識
- カルマンフィルタによる雑音除去法を用いた雑音環境下での音声認識
- カルマンフィルターを用いた雑音環境下における音声認識の検討
- 話者部分空間の入れ替えによる声質変換
- 話者空間の変換による声質変換
- ニュース音声の分類と索引付けにおけるキーワードの重み付けについて
- キーワードスポッティングによるニュース音声の分類
- 音韻分散を考慮した空間変換による音声認識法の検討
- 部分空間分離に基づく音声認識法の検討
- 音韻空間への射影に基づく話者正規化
- 音韻空間への射影に基づく話者正規化による音素認識
- 部分空間法を用いた話者照合における動的・静的特徴統合 -部分空間次元数の事前設定の検討-
- 部分空間法を用いた動的・静的特徴統合による話者照合
- ドラマにおける話者インデキシングの検討
- メッシュ特徴を用いた手書き接触文字の切り出し
- 部分空間法を用いた向きによらない顔の切り出しと認識
- 音声の周期・非周期成分分解に基づく話者認識の検討(一般セッション,音声・言語・対話,一般)