GMMとEMアルゴリズムを用いた加法性雑音及び乗法性歪みの抑圧(耐雑音)(第5回音声言語シンポジウム)

概要

論文の詳細を見る
本研究では,GMMとEMアルゴリズムを用いた加算性雑音と乗法性歪みの抑圧法を提案し,AURORA3と呼ばれる実走行車内音声データベースによる評価を行った.また従来,単一正規分布を基に定式化されていたカルマンフィルタを混合分布型に拡張し,クリーン音声の時間変動と多様性を考慮した,音声信号推定法についても検討を行った.提案手法をAURORA3データベースを用いて評価した結果,AURORA3データベースに含まれる全ての雑音環境において,認識率の改善が得られた.
一般社団法人情報処理学会の論文
2003-12-18

著者

藤本雅清
日本電信電話株式会社NTTコミュニケーション科学基礎研究所
藤本雅清
ATR音声言語コミュニケーション研究所
藤本雅清
龍谷大学理工学部
有木康雄
神戸大学工学部

関連論文

多人数会話シーン分析に向けた実時間マルチモーダルシステムの構築 : マルチモーダル全方位センサを用いた顔方向追跡と話者ダイアリゼーションの統合(テーマセッション2,アンビエント環境知能)
多人数会話シーン分析に向けた実時間マルチモーダルシステムの構築 : マルチモーダル全方位センサを用いた顔方向追跡と話者ダイアリゼーションの統合(テーマ関連セッション2)
音響情報と映像情報の統合による多人数会話における話者決定技術(音響処理・話者同定,第10回音声言語シンポジウム)
音響・言語モデルの適応処理によるスポーツ実況中継の音声認識(音声,聴覚)
音響・言語適応処理を用いたスポーツ実況中継音声の認識 : ハイライトシーン検出への応用
SLP雑音下音声認識評価WG活動報告 : 評価用データと評価手法について(Session-6 スペシャルセッション: 共通コーパスを利用した耐雑音技術評価, 第7回音声言語シンポジウム)
実走行車内単語音声データベースCENSREC-3と共通評価環境の構築
CENSREC-3 : 実走行車内単語音声データベースと評価環境の構築(ポスターセッション)(第6回音声言語シンポジウム)
実環境下音声認識の評価の標準化とその動向(音声・言語における標準化動向)(第6回音声言語シンポジウム)
キーワードスポッティングによる商品紹介映像の商品区間への分割方法の検討
マルチモーダルインタラクションによるニュース映像中の人物認識(システム論文特集号)
音声認識システムSOLONの日本語話し言葉コーパスによる評価(2006年版)(第8回音声言語シンポジウム)
音声認識システムSOLONの日本語話し言葉コーパスによる評価(2006年版)(Session-7 システム,第8回音声言語シンポジウム)
音声区間検出の基礎と最近の研究動向(音声・言語・音響教育,一般)
Dirichlet事前分布を用いた音声区間検出の検討
音声区間検出技術の最近の研究動向
多人数会話シーン分析に向けた実時間マルチモーダルシステムの構築 : マルチモーダル全方位センサを用いた顔方向追跡と話者ダイアリゼーションの統合(テーマセッション2,アンビエント環境知能)
Dirichlet事前分布を用いた音声区間検出の検討(韻律・VAD,第11回音声言語シンポジウム)
CENSREC-2 : 実走行車内における連続数字音声データベースと評価環境の構築
自動車内における連続数字音声コーパスCENSREC-2の設計と評価(Session-7 スペシャルセッション(ポスター): 共通コーパスを利用した耐雑音技術評価, 第7回音声言語シンポジウム)
Switching dynamical systemとパーティクルフィルタを用いた非定常雑音の逐次推定(Session-1 音響モデル・特徴量・学習, 第7回音声言語シンポジウム)
自動車内における連続数字音声コーパスCENSREC-2の設計と評価(Session-7 スペシャルセッション(ポスター): 共通コーパスを利用した耐雑音技術評価, 第7回音声言語シンポジウム)
SLP雑音下音声認識評価WG活動報告 : 評価用データと評価手法について(Session-6 スペシャルセッション: 共通コーパスを利用した耐雑音技術評価, 第7回音声言語シンポジウム)
自動車内における連続数字音声コーパスCENSREC-2の設計と評価(Session-7 スペシャルセッション(ポスター): 共通コーパスを利用した耐雑音技術評価, 第7回音声言語シンポジウム)
SLP雑音下音声認識評価WG活動報告 : 評価用データと評価手法について(Session-6 スペシャルセッション: 共通コーパスを利用した耐雑音技術評価, 第7回音声言語シンポジウム)
Switching dynamical systemとパーティクルフィルタを用いた非定常雑音の逐次推定(Session-1 音響モデル・特徴量・学習, 第7回音声言語シンポジウム)
Switching dynamical systemとパーティクルフィルタを用いた非定常雑音の逐次推定(Session-1 音響モデル・特徴量・学習, 第7回音声言語シンポジウム)
音声認識システムSOLONの日本語話し言葉コーパスによる評価(2006年版)(Session-7 システム,第8回音声言語シンポジウム)
K-60 ニュース映像に対する発話内容と人物問い合わせシステム(ヒューマンインタフェース(HI)3,K.ヒューマンコミュニケーション&インタラクション)
ポスター会話に対する発話区間検出と話者識別の検討(コミュニケーション・対話,第9回音声言語シンポジウム)
ポスター会話に対する発話区間検出と話者識別の検討(コミュニケーション・対話,第9回音声言語シンポジウム)
ポスター会話に対する発話区間検出と話者識別の検討(コミュニケーション・対話,第9回音声言語シンポジウム)
音声情報と画像情報の併用による商品紹介映像のセグメンテーション(音声,聴覚)
GMMとEMアルゴリズムを用いた加法性雑音及び乗法性ひずみの抑圧(音声, 聴覚)
GMMに基づく音声信号推定法と時間領域SVDに基づく音声強調法の併用による雑音下音声認識(音声, 聴覚情報論的学習理論論文)
GMMとEMアルゴリズムを用いた加法性雑音及び乗法性歪みの抑圧(耐雑音)(第5回音声言語シンポジウム)
GMMとEMアルゴリズムを用いた加法性雑音及び乗法性歪みの抑圧(第5回音声言語シンポジウム : 耐雑音)
GMMとEMアルゴリズムを用いた加法性雑音及び乗法性歪みの抑圧(第5回音声言語シンポジウム : 耐雑音)
GMMに基づく音声信号推定法の改良と実走行車内音声による評価
野球中継のハイライトシーン実時間配信を目的としたPCシーンの自動検出(映像・マルチメディアとパターン認識・理解)
野球中継のハイライトシーン実時間配信を目的としたPCシーンの自動検出(映像・マルチメディアとパターン認識・理解)
野球中継のハイライトシーン実時間配信を目的としたPCシーンの自動検出(映像・マルチメディアとパターン認識・理解)
音声認識を用いたスポーツ実況中継におけるハイライトシーン検出
雑音に頑健な音声認識のための時間領域SVDとGMMに基づく音声信号推定法の統合
時間領域SVDとGMMに基づく音声信号推定法の統合による雑音下音声認識
GMMに基づく音声信号推定法を用いた雑音下音声認識
GMMに基づく音声信号推定法を用いた雑音下音声認識
GMMに基づく音声信号推定法を用いた雑音下音声認識
音声区間推定と時間周波数領域方向推定の統合による会議音声話者識別(音響信号処理/一般)
音声認識と文字認識の統合に基づく商品紹介ビデオの区間分割と索引付け
D-14-14 音声情報と画像情報の統合による商品紹介映像の商品区間への分割方法
音響情報と映像情報の統合による多人数会話における話者決定技術(音響処理・話者同定,第10回音声言語シンポジウム)
音響情報と映像情報の統合による多人数会話における話者決定技術(音響処理・話者同定,第10回音声言語シンポジウム)
CENSREC-3 : 実走行車内単語音声データベースと評価環境の構築(ポスターセッション)(第6回音声言語シンポジウム)
実環境下音声認識の評価の標準化とその動向(音声・言語における標準化動向)(第6回音声言語シンポジウム)
CENSREC-3 : 実走行車内単語音声データベースと評価環境の構築(ポスターセッション)(第6回音声言語シンポジウム)
実環境下音声認識の評価の標準化とその動向(音声・言語における標準化動向)(第6回音声言語シンポジウム)
D-11-86 赤外線映像におけるドライバの顔方位判定(D-11.画像工学D(画像処理・計測),一般講演)
音声区間検出と雑音抑圧の統合法を用いた雑音下音声認識(音響処理・話者同定,第10回音声言語シンポジウム)
音声区間検出と雑音抑圧の統合法を用いた雑音下音声認識(音響処理・話者同定,第10回音声言語シンポジウム)
音声区間検出と雑音抑圧の統合法を用いた雑音下音声認識(音響処理・話者同定,第10回音声言語シンポジウム)
確率モデルに基づく音声区間検出と雑音抑圧の統合法の評価と考察(認識,理解,対話,一般)
複数の音声区間検出法の適応的統合の検討と考察(雑音・VAD,第9回音声言語シンポジウム)
雑音除去とモデル適応を併用した雑音下音声認識 : AURORA2タスクでの評価
マイクロフォンアレイとカルマンフィルタを用いたノイズロバストなハンズフリー音声認識の検討
マイクロフォンアレイとカルマンフィルタを用いたノイズロバストなハンズフリー音声認識の検討
カルマンフィルタに基づく音声信号推定法を用いた雑音環境下での音声確認
マルチモーダルインタラクションによるニュース映像中の人物認識と検索 (テーマ:一般)
雑音除去音声に対する特徴量抽出とMLLR適応の統合による雑音に頑健な音声認識
雑音除去音声に対する特徴量抽出とMLLR適応の統合による雑音に頑健な音声認識
雑音除去音声に対する特徴量抽出とMLLR適応の統合による雑音に頑健な音声認識
モデル適応と雑音除去の併用による非定常雑音下での音声認識
カルマンフィルタと繰り返しMLLR適応を用いた非定常雑音下での音声認識
部分空間と混合分布モデルを用いた声質変換
非定常雑音下での連続音声認識を目的とした音声信号の時間推移の推定に基づく雑音除去法の検討
テロップ文字認識に基づく商品紹介ビデオの区間分割 (セッション1 2次元画像技術と応用)
音声の時間変化モデルに基づく音声信号指定法を用いた非定常雑音下での音声認識
音声の時間変化モデルに基づく音声信号推定法を用いた非定常雑音下での音声認識
音声の時間変化モデルに基づく音声信号指定法を用いた非定常雑音下での音声認識
雑音の時間変動を考慮にいれた雑音除去法の検討
パーティクルフィルタとPolyak Averagingを用いた非定常雑音の抑圧(耐雑音)
AR-GARCHモデルに基づいた音声区間検出手法の提案(音声,聴覚)
複数の音声区間検出法の適応的統合の検討と考察
複数の音声区間検出法の適応的統合の検討と考察(雑音・VAD,第9回音声言語シンポジウム)
複数の音声区間検出法の適応的統合の検討と考察(雑音・VAD,第9回音声言語シンポジウム)
音声と雑音両方の状態遷移過程を有する雑音下音声区間検出(第8回音声言語シンポジウム)
音声と雑音両方の状態遷移過程を有する雑音下音声区間検出(Session-1 検出,第8回音声言語シンポジウム)
音声と雑音両方の状態遷移過程を有する雑音下音声区間検出(Session-1 検出,第8回音声言語シンポジウム)
実環境下での話者認識におけるPMC法の効果について
雑音環境下での音声認識を目的とした高速カルマンフィルタによる雑音除去法の提案
カルマンフィルタによる雑音除去法を用いた雑音環境下での音声認識
カルマンフィルタによる雑音除去法を用いた雑音環境下での音声認識
カルマンフィルタによる雑音除去法を用いた雑音環境下での音声認識
カルマンフィルターを用いた雑音環境下における音声認識の検討
話者部分空間の入れ替えによる声質変換
話者空間の変換による声質変換
話者適応と雑音混合モデル推定の同時適用による雑音抑圧(耐雑音処理,第13回音声言語シンポジウム)
話者適応と雑音混合モデル推定の同時適用による雑音抑圧(耐雑音処理,第13回音声言語シンポジウム)
音声区間検出の基礎と世界的な研究動向,今後の展開
音声の周期・非周期成分分解に基づく話者認識の検討(一般セッション,音声・言語・対話,一般)

GMMとEMアルゴリズムを用いた加法性雑音及び乗法性歪みの抑圧(耐雑音)(第5回音声言語シンポジウム)

スポンサーリンク

概要

著者

関連論文

スポンサーリンク