発話速度に依存したデコーディングと音響モデルの適応、
スポンサーリンク
概要
- 論文の詳細を見る
大語彙の話し言葉音声認識における発話速度に関する問題に焦点をあてた認識手法について報告する。話し言葉音声では発話速度は一般に速く変動も大きいため、認識が困難である。実際に認識結果において、特に速い音声で認識率が低いこと、及び発話速度の速い音声と遅い音声では認識誤り傾向に明確な差があることを確認した。そこで、発話速度に応じて最適な音響分析フレーム・音素モデル・デコーディングパラメータを選択的に適用し認識を行う手法を提案する。発話速度の自動推定を組み合わせることにより認識率の向上を得た。さらに、発話速度情報を話者適応に用いる手法についても検討を行う。速い発話と遅い発話のそれぞれを指向した異なる話者適応モデルを構築しそれらを選択的に適用することで、速度情報を用いない適応よりも効率的な適応が行えることを確認した。
- 社団法人電子情報通信学会の論文
- 2001-12-14
著者
関連論文
- 音声理解を指向したベイズリスク最小化枠組みに基づく音声認識(音声,聴覚)
- 単語グラフを利用したベイズリスク最小化音声認識とそれに基づく重要文抽出(第8回音声言語シンポジウム)
- 単語グラフを利用したベイズリスク最小化音声認識とそれに基づく重要文抽出(Session-4 一般(ポスターセッション),第8回音声言語シンポジウム)
- 単語の重要度を考慮したベイズリスク最小化音声認識とそれに基づく情報検索(Session-2 情報検索, 第7回音声言語シンポジウム)
- SLP音声ドキュメント処理ワーキンググループ活動報告(ドキュメント処理・翻訳・言語獲得,第10回音声言語シンポジウム)
- 音声ドキュメント検索評価のためのテストコレクションの試作(第8回音声言語シンポジウム)
- 音声ドキュメント検索評価のためのテストコレクションの試作(Session-4 一般(ポスターセッション),第8回音声言語シンポジウム)
- 話し言葉における引用節の自動認定および引用符の付与(第8回音声言語シンポジウム)
- 話し言葉における引用節の自動認定および引用符の付与(Session-4 一般(ポスターセッション),第8回音声言語シンポジウム)
- 話し言葉における引用節の自動認定および引用符の付与
- 単語の重要度を考慮したベイズリスク最小化音声認識とそれに基づく情報検索(Session-2 情報検索, 第7回音声言語シンポジウム)
- 単語の重要度を考慮したベイズリスク最小化音声認識とそれに基づく情報検索(Session-2 情報検索, 第7回音声言語シンポジウム)
- 単語グラフを利用したベイズリスク最小化音声認識とそれに基づく重要文抽出(Session-4 一般(ポスターセッション),第8回音声言語シンポジウム)
- Spoken Term Detection のためのテストコレクション構築とベースライン評価
- 統計的前編集のための対訳コーパスからの学習データの自動生成
- NTCIR-9 SpokenDoc: 音声検索語検出と音声ドキュメント検索の評価枠組の設計
- 音声中の検索語検出のためのテストコレクション構築 : 中間報告
- SLP音声ドキュメント処理ワーキンググループ活動報告(ドキュメント処理・翻訳・言語獲得,第10回音声言語シンポジウム)
- SLP音声ドキュメント処理ワーキンググループ活動報告(ドキュメント処理・翻訳・言語獲得,第10回音声言語シンポジウム)
- Spoken Term Detectionのためのテストコレクション構築とベースライン評価
- Spoken Term Detectionのためのテストコレクション構築とベースライン評価
- 最適フロアリング係数を用いた反復スペクトルサブトラクションによるミュージカルノイズの低減(オーガナイズドセッション:スピーチエンハンスメント,音声,応用/電気音響,信号処理,及び一般)
- スライド情報を用いた言語モデル適応による講義音声認識
- Spoken Term Detection のためのテストコレクション構築とベースライン評価
- 質問応答・情報推薦機能を備えた音声による情報案内システム(音声質問応答,インタラクションの理解とデザイン)
- ドメインとスタイルを考慮したWebテキストの選択による音声対話システム用言語モデルの構築(音声,聴覚)
- シナリオ記述を状況に依存して実行する対話エージェントのアーキテクチャ
- シナリオ記述を状況に依存して実行する対話エージェントのアーキテクチャ
- 音声ドキュメント検索評価のためのテストコレクションの試作(Session-4 一般(ポスターセッション),第8回音声言語シンポジウム)
- 局所的な係り受けの情報を用いた話し言葉の節・文境界の推定
- ポスター会話に対する発話区間検出と話者識別の検討(コミュニケーション・対話,第9回音声言語シンポジウム)
- ポスター会話に対する発話区間検出と話者識別の検討(コミュニケーション・対話,第9回音声言語シンポジウム)
- ポスター会話に対する発話区間検出と話者識別の検討(コミュニケーション・対話,第9回音声言語シンポジウム)
- 話し言葉における引用節の自動認定および引用符の付与(Session-4 一般(ポスターセッション),第8回音声言語シンポジウム)
- 2000-SLP-31-11 種々のタスクにおける大語彙連続音声認識システムの性能評価と診断
- 対話音声認識を指向した音響モデルの構築
- 発話検証に基づく音声操作プロジェクタとそれによる講演の自動ハイパーテキスト化 (音声言語情報処理)
- 文法カテゴリ対制約を用いたA^*探索に基づく大語彙連続音声認識パーザ (音声言語情報処理)
- 単語トレリスインデックスを用いた段階的探索による大語彙連続音声認識
- 文法カテゴリ対制約を用いたA^*探索に基づく大語彙連続音声認識パーザ
- 汎用的な情報検索音声対話プラットフォーム
- 文法カテゴリ対制約を用いたA^*探索に基づく大語彙連続音声認識パーザ
- 汎用的な情報検索音声対話プラットフォーム
- 文法カテゴリ対制約を用いたA^*探索に基づく大語彙連続音声認識パーザ
- 汎用的な情報検索音声対話プラットフォーム
- 統計的前編集のための対訳コーパスからの学習データの自動生成 (音声)
- 統計的前編集のための対訳コーパスからの学習データの自動生成 (言語理解とコミュニケーション)
- 音声中の検索語検出のためのテストコレクション構築 -中間報告-
- 単語グラフを利用したベイズリスク最小化音声認識とそれに基づく重要文抽出
- 音声による大規模知識ベース検索のための単語重要度を考慮したベイズリスク最小化デコーディング
- 音声理解のための音声認識評価尺度とベイズリスク最小化デコーディング(大語彙音声認識)(第6回音声言語シンポジウム)
- E-002 高フロアリング係数を用いた反復スペクトルサブトラクションによるミュージカルノイズの低減の検討(E分野:自然言語・音声・音楽,一般論文)
- 音声対話によるソフトウェアサポートタスクのための効率的な確認戦略(音声, 聴覚)
- 2ZN-1 ポスター会話中の音リアクションイベントに基づくホットスポットの抽出(情報爆発時代における対話インタラクション,学生セッション,「情報爆発」時代に向けた新IT基盤技術,情報処理学会創立50周年記念(第72回)全国大会)
- 英語韻律発音学習支援システムのための英語文強勢のモデル化と自動検出
- CALLシステムのための英語文強勢知覚のモデル化
- 大規模な日本語話し言葉データベースを用いた講演音声認識
- 話し言葉音声認識のための言語モデルとデコーダの改善
- 話し言葉音声認識のための言語モデルとデコーダの改善
- 講演音声認識のための音響・言語モデルの検討
- 講演音声認識のための音響・言語モデルの検討
- 講演音声認識のための音響・言語モデルの検討
- 講演ディクテーションのための話題独立言語モデルと話題適応
- 講演ディクテーションのための話題独立言語モデルと話題適応
- 複合的言語制約に基づくキーフレーズ検出を用いた汎用的なデータベース検索音声対話プラットフォーム
- 音声言語を用いた仮想空間との対話による試着システム(次世代ヒューマンインタフェース・インタラクション)
- 音声言語を用いた仮想空間との対話による試着システム
- 京大総合情報メディアセンターにおけるCALLの試み
- 京大総合情報メディアセンターにおけるCALLの試み
- 機械翻訳のための統計的手法に基づく前編集
- 談話標識の統計的選択に基づいたCSJの講演からの重要文抽出(言語モデル・要約)(第5回音声言語シンポジウム)
- 談話標識の統計的選択に基づいたCSJの講演からの重要文抽出(第5回音声言語シンポジウム : 言語モデル・要約)
- 談話標識の統計的選択に基づいたCSJの講演からの重要文抽出(第5回音声言語シンポジウム : 言語モデル・要約)
- 談話標識と話題語に基づく統計的尺度による講演からの重要文抽出(自然言語情報処理研究会と一部合同開催 : NL・SLP合同開催 : 音声対話1)
- 談話標識と話題語に基づく統計的尺度による講演からの重要文抽出
- 講演音声認識のための言語モデルの教師なし適応
- 講演音声認識のための言語モデルの教師なし適応
- 講演音声認識のための言語モデルの教師なし適応
- D-14-8 ベイズリスク最小化音声認識に基づく大学情報検索システムの構築(D-14.音声,一般セッション)
- 音声入力型大学情報検索システムに対するベイズリスク最小化音声認識の適用
- 音声入力型大学情報検索システムに対するベイズリスク最小化音声認識の適用
- 講演の書き起こしに対する統計的手法を用いた文体の整形
- ドキュメント翻訳のための統計的手法に基づく原言語文の自動変換
- 音声理解のための音声認識評価尺度とベイズリスク最小化デコーディング(大語彙音声認識)(第6回音声言語シンポジウム)
- 音声理解のための音声認識評価尺度とベイズリスク最小化デコーディング(大語彙音声認識)(第6回音声言語シンポジウム)
- 講演音声認識のための教師なし言語モデル適応と発話速度に適応したデコーディング(音声,聴覚)
- 講演音声認識のための話題・話者・発音変動に適応した言語モデル
- 発話速度に依存したデコーディングと音響モデルの適応
- 発話速度に依存したデコーディングと音響モデルの適応、
- 発話速度に依存したデコーディングと音響モデルの適応
- 発話速度に依存したデコーディングの検討
- 講演音声認識のための話速別モデル化の検討
- 種々の大語彙連続音声認識タスクにおける認識誤りの自動診断
- 大語彙連続音声認識における認識誤り原因の自動同定
- 大語彙連続音声認識における認識誤り原因の自動同定
- クラウド時代の新しい音声研究パラダイム
- 音声ドキュメント処理ワーキンググループ活動報告(音声検索,第13回音声言語シンポジウム)
- 音声ドキュメント処理ワーキンググループ活動報告(音声検索,第13回音声言語シンポジウム)
- 音声ドキュメント処理ワーキンググループ活動報告
- 音声ドキュメント処理ワーキンググループ活動報告