分散音声認識における実時間周波数特性正規化手法(音声言語)
スポンサーリンク
概要
- 論文の詳細を見る
本論文では,分散音声認識(DSR: Distributed Speech Recognition)における人力系の周波数特性の差異による認識性能劣化を抑制する周波数特性正規化手法として,複数参照ケプストラムを用いた実時間周波数特性正規化手法を提案する.提案手法は,複数の参照ケプストラムを使用し,周波数特性の正規化を行うバイアスをフレーム同期で計算し,実時間で入力系の周波数特性を正規化する手法である.一般に,DSRで用いられるクライアントではメモリ量,計算量の制限があるため,提案手法ではこれらの増加量を低減させるため,参照ケプストラムをDSRフロントエンドの特徴パラメータ圧縮部で使用されるVQコードブックの組合せで表現した.ETSI Advanced DSRフロントエンドを用いた日本音響学会新聞記事読み上げ音声コーパスの音声認識実験より,提案手法は,ETSI Advanced DSRフロントエンドにおけるBlind Equalizationと比較し,周波数特性の差異による音声認識精度劣化の抑制に有効であることを確認した.特に,提案手法はMIRSフィルタ条件下でETSI Advanced DSRフロントエンド(Blind Equalization)の単語誤り率を10.8%削減することが可能であった.
- 一般社団法人情報処理学会の論文
- 2007-02-15
著者
-
獅々堀 正幹
徳島大学工学部知能情報工学科
-
黒岩 眞吾
千葉大学
-
任 福継
Tokushima Univ. Tokushima‐shi Jpn
-
黒岩 眞吾
徳島大学工学部
-
任 福継
徳島大学工学部
-
北 研二
徳島大学高度情報化基盤センター
-
北 研二
徳島大
-
柘植 覚
大同大学
-
柘植 覚
徳島大学工学部
-
獅々堀 正幹
徳島大学大学院ソシオテクノサイエンス研究部情報ソリューション部門
-
黒岩 眞吾
(株)ケイディディ研究所
-
黒岩 眞吾
徳島大学工学部 電気電子工学科
-
柘植 覚
徳島大学大学院ソシオテクノサイエンス研究部情報ソリューション部門
-
北 研二
徳島大学
-
Tsuge Satoru
Atr Interpreting Telecommunications Research Laboratories
-
獅子堀 正幹
徳島大学工学部
-
獅子堀 正幹[他]
徳島大学工学部
関連論文
- 話者交替規則に基づいた日本手話対話の話者交替の分析
- 日本語定型表現のパターン記述規則と効率的な照合アルゴリズム
- 意味変化率を考慮した文書短縮方法
- 日本語定型表現の分析と効率的照合アルゴリズム
- 活用語を含む助詞的定型表現の分析
- 実用会話システムにおける対話型案内コンテンツの構築
- 実用会話システムにおける対話型案内コンテンツの構築(対話)
- 日本手話の表現速度の違いによる手動作変化の分析(福祉と音声処理,一般)
- Webページ間の関係に着目した大規模サイトの構造化の調査 : 音声ブラウザ利用におけるアクセシビリティの検討
- 雑音下音声認識評価ワーキンググループ活動報告 : 認識に影響する要因の個別評価環境(3)(SIG-SLP内組織の活動報告)
- 雑音下音声認識評価ワーキンググループ活動報告 : 認識に影響する要因の個別評価環境(2)(雑音・VAD,第9回音声言語シンポジウム)
- 雑音下音声認識評価ワーキンググループ活動報告 : 認識に影響する要因の個別評価環境 (2)(雑音・VAD,第9回音声言語シンポジウム)
- 雑音下音声認識評価ワーキンググループ活動報告 : 認識に影響する要因の個別評価環境(第8回音声言語シンポジウム)
- 雑音下音声認識評価ワーキンググループ活動報告 : 認識に影響する要因の個別評価環境(Session-1 検出,第8回音声言語シンポジウム)
- 大規模話者骨導音声データベースを用いたテキスト独立型話者照合実験(一般(ポスターセッション),第9回音声言語シンポジウム)
- CENSREC-1-C : 雑音下音声区間検出評価基盤の構築
- SLP雑音下音声認識評価WG活動報告 : 評価用データと評価手法について(Session-6 スペシャルセッション: 共通コーパスを利用した耐雑音技術評価, 第7回音声言語シンポジウム)
- 3DCGによる手話文アニメーション合成システムの構築と評価(福祉と知能・情動・認知障害,福祉と音声処理,一般)
- 感情生起事象文型パターンに基づいた会話文からの感情推定手法
- 感情コーパス作成支援システムの開発(コーパス, 学習, 対話, 要約)
- WWW画像検索システムを用いた関連語の自動収集手法(検索)
- 講義映像配信システムにおける講義映像と資料の対応
- 大規模話者骨導音声データベースを用いたテキスト独立型話者照合実験(一般(ポスターセッション),第9回音声言語シンポジウム)
- 大規模話者骨導音声データベースを用いたテキスト独立型話者照合実験(一般(ポスターセッション),第9回音声言語シンポジウム)
- 雑音下音声認識評価ワーキンググループ活動報告 : 認識に影響する要因の個別評価環境(2)(雑音・VAD,第9回音声言語シンポジウム)
- 雑音下マルチモーダル音声認識評価基盤CENSREC-1-AVの構築
- 順位統計量を用いた話者照合のためのコホート話者選択方法
- 順位統計量を用いた話者照合のためのコホート話者選択方法
- Super-Function に基づく日英機械翻訳における日付・時間表現の抽出
- 符号化音声認識のための合成音声を用いた不特定話者音響モデルの適応法(音声,聴覚)
- Super-Functionを用いた日英機械翻訳における日付・時間表現の抽出
- N-gram出現頻度を用いた感情類似度計算
- 感情コーパス構築のための文中の語に基く感情分類手法
- Super-Functionを用いた日英機械翻訳における日付・時間表現の抽出(用語・情報抽出)
- N-gram出現頻度を用いた感情類似度計算(感情・評価)
- 感情コーパス構築のための文中の語に基く感情分類手法(感情・評価)
- 分散音声認識における実時間周波数特性正規化手法(音声言語)
- 雑音下音声認識評価ワーキンググループ活動報告 : 認識に影響する要因の個別評価環境(Session-1 検出,第8回音声言語シンポジウム)
- SLP雑音下音声認識評価WG活動報告 : 評価用データと評価手法について(Session-6 スペシャルセッション: 共通コーパスを利用した耐雑音技術評価, 第7回音声言語シンポジウム)
- SLP雑音下音声認識評価WG活動報告 : 評価用データと評価手法について(Session-6 スペシャルセッション: 共通コーパスを利用した耐雑音技術評価, 第7回音声言語シンポジウム)
- 位置と動きに基づくマルチストリームHMMを用いた手話認識
- 手の位置と動きに着目したHMMによる手話単語の認識(一般,膨大なデータから学ぶもの)
- 手の位置と動きに着目したHMMによる手話単語の認識(一般,膨大なデータから学ぶもの)
- 順位統計量を用いた話者照合のためのコホート話者選択方法(一般(ポスターセッション),第11回音声言語シンポジウム)
- スペクトルの微細構造を考慮した風雑音除去手法(電気音響,音響一般)
- 多数の話者モデル内での順位情報を用いた話者照合
- 3DCGによる手話文アニメーション合成システムの構築と評価(福祉と知能・情動・認知障害,福祉と音声処理,一般)
- 3DCGによる手話文アニメーション合成システムの構築と評価(福祉と知能・情動・認知障害,福祉と音声処理,一般)
- 書き起こしへの付与を目指した音声とテキストを対象とした発話印象の分析
- 日本手話対話におけるうなずきの機能に関する基礎的検討
- 早口再合成音声における韻律強調と聞き取りやすさの関係の分析
- 音声認識の信頼度に着目した文境界検出に関する検討(一般(ポスターセッション),第11回音声言語シンポジウム)
- 音声認識の信頼度に着目した文境界検出に関する検討
- 視覚障害者のための意味情報を用いた仮名漢字変換における説明語選択手法の検討(福祉と音声処理,一般)
- 曲中のブレスによる合図を利用した伴奏システム
- 日本手話対話の話者交替時の重複現象の分析
- 日本手話対話の話者交替時の重複現象の分析(一般セッション,コミュニケーション支援,共生コミュニケーション及び一般)
- 日本手話対話の話者交替時の重複現象の分析(一般セッション,コミュニケーション支援,共生コミュニケーション及び一般)
- 日本手話対話の話者交替時の重複現象の分析(一般セッション,コミュニケーション支援,共生コミュニケーション及び一般)
- 13-105 学生自主プロジェクト活動実態に関する考察((17)工学教育システムの個性化・活性化-II)
- Super-Functionによる機械翻訳エンジンのWeb実現について(機械翻訳)
- 多属性項目の履歴情報に基づく電子メイル文書のフィルタリング手法
- 履歴情報を考慮したメイル文書のフィルタリング手法
- WWW画像検索システムにおける有害画像フィルタリング手法
- D-020 WWW画像検索システムにおける有害画像フィルタリング手法(D分野:データベース)
- D-030 WWW画像検索システムを用いた有害サイトURLデータベースの構築手法(D.データベース)
- 距離索引VP-treeにおける解絞り込みの一改良法(基盤・要素技術)(セマンティックウェブと自然言語処理その他一般)
- 距離索引VP-treeにおける解絞り込みの一改良法
- ベクトル空間モデルに基づく特定領域向け中国語質問応答システムの構築
- 分野連想語を用いたパッセージ特定手法
- 拡張ハッシュ法における部分文字列検索の設計と実現
- トライ構造を用いた共起情報の効率的検索アルゴリズム
- グラフ構造に対する効率的記憶検索法
- 文書レイアウトにおける自動図表配置手法
- 片仮名異表記の生成および統一手法
- 階層化による2進ディジタル探索(BDS)木の改善
- 時間推移を考慮した単語の重要度決定手法
- キーワード抽出を用いた文書自動分類手法
- パトリシアトライ構造の効率的な圧縮アルゴリズム
- Earth Mover's Distance の高速検索ライブラリ fastEMD の開発
- 字幕付き映像データからの字幕領域の検出手法
- 順位キューを用いた多次元データの高速近傍検索アルゴリズム
- 出現URLの類似性に着目したWWW空間からの関連語自動収集手法(抽出, 言い換え)
- MPEG映像データに対するカットシーンの高速検出手法
- D-040 領域分割画像に基づく言語メタデータの自動生成手法(D.データベース)
- 2進木トライ構造の効率的な圧縮手法
- トライ構造による概念階層の高速判定アルゴリズム
- 多次元データの高速近傍検索アルゴリズム(基盤・要素技術)(セマンティックウェブと自然言語処理その他一般)
- 1次元自己組織化マップを用いた高次元データの高速近傍検索
- 1次元自己組織化マップを用いた高次元データの高速近傍検索
- 画像,音声,テキストに対するマルチデータ処理技術の統合化とその応用
- HTML形式の表構造に対する一索引化手法
- WWW空間上に存在する表構造の一索引化手法
- キーワード構成の分析とその応用
- 接続情報を加味した形態素辞書による形態素解析の高速化
- サポートベクターマシンによる適合性フィードバックを用いた情報検索(情報検索)
- サポートベクターマシンによる適合性フィードバックを用いた情報検索
- 画像知識データベースを用いたWWW画像検索システムの開発(画像検索・映像データベース)
- Non-negative Matrix Factorizationを用いた情報検索モデルの次元圧縮および検索質問拡張
- Non-negative Matrix Factorizationを用いた情報検索