音声のピッチ変動の耐雑音音声認識における効果
スポンサーリンク
概要
- 論文の詳細を見る
分析フレーム内での繰り返し波形を分割、加算平均した1周期の波形を用いることにより耐雑音性を高めた新しいスペクトル推定法PHASORを提案する。提案アルゴリズムは雑音下母音知覚実験結果に基づいている。音声スペクトルは、従来のようにフレーム内の全波形から求めるのではなく、繰り返しの単位波形から求める。繰り返しの単位波形は、声門の開閉タイミングの時間的揺らぎを補正して求める。これにより、周期性雑音、ランダム雑音の両方に対して耐雑音性が向上する。不特定話者、特定話者両音声認識実験により、PHASORの耐雑音性効果を示した。本方法は有声音の認識誤りを大幅に減少できる。PHASORにより、従来のスペクトル減算法やケプストラム平均正規化法と比べて高い認識性能が得られた。
- 一般社団法人情報処理学会の論文
- 2001-12-20
著者
関連論文
- 多人数会話シーン分析に向けた実時間マルチモーダルシステムの構築 : マルチモーダル全方位センサを用いた顔方向追跡と話者ダイアリゼーションの統合(テーマセッション2,アンビエント環境知能)
- 多人数会話シーン分析に向けた実時間マルチモーダルシステムの構築 : マルチモーダル全方位センサを用いた顔方向追跡と話者ダイアリゼーションの統合(テーマ関連セッション2)
- 音響情報と映像情報の統合による多人数会話における話者決定技術(音響処理・話者同定,第10回音声言語シンポジウム)
- 音声認識システムSOLONの日本語話し言葉コーパスによる評価(2006年版)(第8回音声言語シンポジウム)
- 音声認識システムSOLONの日本語話し言葉コーパスによる評価(2006年版)(Session-7 システム,第8回音声言語シンポジウム)
- 音声認識システムSOLONの日本語話し言葉コーパス(公開版Ver.1.0)による評価(Session-4 システム・言語モデル, 第7回音声言語シンポジウム)
- 2. 個別技術 / 要素技術 : 2-1 しゃべって入力・音声で応答 (気の利いた情報システム)
- 音声区間検出技術の最近の研究動向
- 多人数会話シーン分析に向けた実時間マルチモーダルシステムの構築 : マルチモーダル全方位センサを用いた顔方向追跡と話者ダイアリゼーションの統合(テーマセッション2,アンビエント環境知能)
- 乳幼児の母音に対する周波数ピークの縦断的分析
- 音声認識システムSOLONの日本語話し言葉コーパスによる評価(2006年版)(Session-7 システム,第8回音声言語シンポジウム)
- 音声認識システムSOLONの日本語話し言葉コーパス(公開版Ver.1.0)による評価(Session-4 システム・言語モデル, 第7回音声言語シンポジウム)
- 音声認識システムSOLONの日本語話し言葉コーパス(公開版Ver.1.0)による評価(Session-4 システム・言語モデル, 第7回音声言語シンポジウム)
- 幻の「っ」--日本語促音の知覚発達過程
- 人の検索行動における情報入手戦略の視線による分析
- ポスター会話に対する発話区間検出と話者識別の検討(コミュニケーション・対話,第9回音声言語シンポジウム)
- ポスター会話に対する発話区間検出と話者識別の検討(コミュニケーション・対話,第9回音声言語シンポジウム)
- ポスター会話に対する発話区間検出と話者識別の検討(コミュニケーション・対話,第9回音声言語シンポジウム)
- 複数文脈を用いる音声対話システムにおける統計モデルに基づく談話理解法
- "反省型"信頼性尺度に基づく書き起こしなしデータを用いた言語モデル学習
- "反省型"信頼性尺度に基づく書き起こしなしデータを用いた言語モデル学習
- 音声区間推定と時間周波数領域方向推定の統合による会議音声話者識別(音響信号処理/一般)
- 確認対象ごとの認識性能を考慮する効率的対話制御法(音声対話・翻訳)
- 単一ドメインシステムの統合による複数ドメイン音声対話システム
- 2つの認識文法を用いた主導権混合型対話制御
- 2つの認識文法を用いた主導権混合型対話制御
- システム知識制限下での効率的音声対話制御法
- 確認対象での認識性能を考慮する効率的対話制御法
- 決定木学習による音声対話システムのための話者交代判定法
- 決定木学習による音声対話システムのための話者交代判定法
- エントロピーによる重み付けを用いた雑音環境下での基本周波数推定
- 音響情報と映像情報の統合による多人数会話における話者決定技術(音響処理・話者同定,第10回音声言語シンポジウム)
- 音響情報と映像情報の統合による多人数会話における話者決定技術(音響処理・話者同定,第10回音声言語シンポジウム)
- マルチモーダル対話による共同作業における指示表現の分析
- 逐次発話理解法による対話音声理解(音声,聴覚)
- 逐次理解を行う音声対話システムの発話理解評価法
- 逐次理解を行う音声対話システムの発話理解評価法
- N-Best 認識候補を用いた逐次言語理解によるロバストな音声理解法
- n-best音声認識と逐次理解法によるロバストな音声理解
- n-best音声認識と逐次理解法によるロバストな音声理解
- 決定木を用いた未知語属性推定による効率的対話方法
- 音声対話における実例に基づく未知語属性推定
- 音声区間検出と雑音抑圧の統合法を用いた雑音下音声認識(音響処理・話者同定,第10回音声言語シンポジウム)
- 音声区間検出と雑音抑圧の統合法を用いた雑音下音声認識(音響処理・話者同定,第10回音声言語シンポジウム)
- 音声区間検出と雑音抑圧の統合法を用いた雑音下音声認識(音響処理・話者同定,第10回音声言語シンポジウム)
- 確率モデルに基づく音声区間検出と雑音抑圧の統合法の評価と考察(認識,理解,対話,一般)
- 複数の音声区間検出法の適応的統合の検討と考察(雑音・VAD,第9回音声言語シンポジウム)
- AR-GARCHモデルに基づいた音声区間検出手法の提案(音声,聴覚)
- 複数の音声区間検出法の適応的統合の検討と考察
- 複数の音声区間検出法の適応的統合の検討と考察(雑音・VAD,第9回音声言語シンポジウム)
- 複数の音声区間検出法の適応的統合の検討と考察(雑音・VAD,第9回音声言語シンポジウム)
- 音声特徴抽出法SPADEを用いたフロントエンドの耐雑音評価標準コーパスによる評価(Session-7 スペシャルセッション(ポスター): 共通コーパスを利用した耐雑音技術評価, 第7回音声言語シンポジウム)
- 音声特徴抽出法SPADEを用いたフロントエンドの耐雑音評価標準コーパスによる評価(Session-7 スペシャルセッション(ポスター): 共通コーパスを利用した耐雑音技術評価, 第7回音声言語シンポジウム)
- 音声と雑音両方の状態遷移過程を有する雑音下音声区間検出(第8回音声言語シンポジウム)
- 音声と雑音両方の状態遷移過程を有する雑音下音声区間検出(Session-1 検出,第8回音声言語シンポジウム)
- 音声と雑音両方の状態遷移過程を有する雑音下音声区間検出(Session-1 検出,第8回音声言語シンポジウム)
- Exponential 自己回帰モデルを用いた音声信号分析方法
- 雑音下母音聴取における雑音の調波構造の影響
- 非線形変換フィルタによる音声特徴抽出
- 妨害音下母音知覚における母音の各周波数帯域での振幅変動の影響
- フレーム内波形処理による耐雑音スペクトル推定
- 音声のピッチ変動の耐雑音音声認識における効果
- 音声のピッチ変動の耐雑音音性認識における効果
- 音声のピッチ変動の耐雑音音声認識における効果
- 調波複合音下母音知覚における母音の振幅・基本周波数の時間変動の影響
- 白色雑音・調波複合音下での母音知覚特性の比較
- 雑音下母音聴取における雑音のスペクトル構造の影響
- 雑音下母音聴取における雑音のスペクトル構造の影響
- 音声の周期性・非周期性成分比とSwitching Kalman filterに基づく雑音下音声区間検出(音響処理)
- 日本語学習乳児の音声口形マッチングの発達に関する母音/i/を用いた検討