SP2000-23 言語モデルの役割と韻律情報との相互作用を用いた大語彙連続音声認識の探索空間の最適制御
スポンサーリンク
概要
- 論文の詳細を見る
情報源としての韻律-統語境界は音声認識における探索空間の制約に利用することが可能である。本論文では大語彙連続音声認識における単語間遷移と単語内部遷移を考慮した動的ビーム探索の方法を提案し、既存の認識デコーダに韻律-統語境界を導入することを考慮する。大語彙連続音声認識における木構造単語辞書の問題は言語モデルのスコアの適用がビーム探索の音響モデルのスコアの適用と整合されないことであり、巨大な探索空間を必要とする。本稿ではビーム幅を選択する場合の言語モデルの影響と韻律-統語境界情報を利用する戦略を延べ、効率的に計算量を減少させる方法を提案する。評価実験は日本語新聞記事文章2万単語タスクとn-gram言語モデルに対し行ない、その結果から提案したアルゴリズムの有効性を証明する。
- 社団法人電子情報通信学会の論文
- 2000-06-16
著者
関連論文
- 3次元母音図の4次元可視化に向けた基礎研究(視聴覚技術,ヒューマンインタフェース)
- 母語話者と中国語話者の日本語朗読音声の基本周波数パターンの比較
- 英語・中国語・母語話者の日本語朗読音声のF0に現れる特徴(音声生成・知覚,聴覚心理,音声学・音韻論,一般)
- 基本周波数パターン生成過程モデルに基づく日本語学習者音声の韻律の分析(一般)
- 中国語話者の日本語朗読音声の韻律的特徴と母語話者評価(聴覚・音声・言語とその障害,一般)
- 日本語CALLシステムのための学習者発音分析とその自動評価(一般)
- 通訳者支援システム「イズ」とその情報保障支援の可能性(聴覚と福祉情報工学・一般)
- 音声の構造的表象に基づく異言語間・異話者間の音声変換手法(言語獲得・学習,合成,生成,韻律,一般)
- 構造評価関数を用いた構造的表象からの音声合成系の高精度化(言語獲得・学習,合成,生成,韻律,一般)
- 話者不変な相対関係特徴を音響単位とする音響モデリングに関する実験的検討 (音声)
- 構造表象を用いた音声認識におけるパラメータ共有とその効果(認識,理解,対話,一般)
- 構造的表象からの音声合成とそれに基づく音声模倣に関する検討(音声生成・知覚,聴覚心理,音声学・音韻論,一般)
- ケプストラムの声道長依存性に関する幾何学的考察(一般(ポスターセッション),第9回音声言語シンポジウム)
- 構造的表象からの音声生成に関する基礎的検討(合成,生成,韻律,一般)
- 基本周波数パターン生成過程モデルに基づくコーパスベース韻律生成における柔軟な焦点制御(言語獲得・学習,合成,生成,韻律,一般)
- 生成過程モデルを用いたHMMに基づく基本周波数パターン生成 (音声)
- 手の動きを入力としたリアルタイム音声生成系における鼻音の合成とピッチ制御に関する検討(福祉と音声処理,一般)
- 経験的モード分解による主構造抽出を介した雑音環境下における音声信号の基本周波数推定
- 3次元母音図の4次元可視化に向けた基礎研究
- スペクトル領域特徴量を用いた音声の構造的表象に関する実験的考察(音声生成・知覚,聴覚心理,音声学・音韻論,一般)
- 生成過程モデルを用いたHMMに基づく基本周波数パターン生成(音声・言語・音響教育,一般)
- ボトムアップクラスタリングを用いたシャドーイング音声の自動評定(聴覚・音声・言語とその障害,一般)
- 制約条件付きクラスタリングによる連続音声からのイベント境界検出(認識,理解,対話,一般)
- ケプストラムの声道長依存性に関する幾何学的考察(一般(ポスターセッション),第9回音声言語シンポジウム)
- ケプストラムの声道長依存性に関する幾何学的考察(一般(ポスターセッション),第9回音声言語シンポジウム)
- 話者不変な相対関係特徴を音響単位とする音響モデリングに関する実験的検討(音響モデル,第11回音声言語シンポジウム)
- 話者不変な相対関係特徴を音響単位とする音響モデリングに関する実験的検討(音響モデル,第11回音声言語シンポジウム)
- 音声の構造的表象と判別分析を用いた単語音声認識(ポスターセッション,第10回音声言語シンポジウム)
- アフィン変換不変性を有する局所的特徴量を用いた音声認識(ポスターセッション,第10回音声言語シンポジウム)
- 音声の構造的表象と判別分析を用いた単語音声認識(ポスターセッション,第10回音声言語シンポジウム)
- アフィン変換不変性を有する局所的特徴量を用いた音声認識(ポスターセッション,第10回音声言語シンポジウム)
- 音声の構造的表象と判別分析を用いた単語音声認識(ポスターセッション,第10回音声言語シンポジウム)
- アフィン変換不変性を有する局所的特徴量を用いた音声認識(ポスターセッション,第10回音声言語シンポジウム)
- 空間写像に基づく手の動きを入力とした音声生成系の構築(マルチモーダル)
- 2ZL-6 大規模英語学習者を対象とした音声の構造的表象に基づく発音分類とその応用(情報爆発時代におけるコミュニケーション手法,学生セッション,「情報爆発」時代に向けた新しいIT基盤技術)
- 音声の構造的表象に基づく発音矯正必要度の計算手法の検討(聴覚・音声/一般)
- 音声の構造的表象に基づく英語学習者発音の音響的分析(音声,聴覚)
- 音声の構造的表象とその距離尺度(一般, 一般, チュートリアルレクチャー)
- 音声の構造的表象とその距離尺度
- 音声の構造的表象を用いた雑音環境下における日本語母音系列の自動認識(Session-8 ポスターセッション: 一般, 第7回音声言語シンポジウム)
- 音声の構造的表象を用いた雑音環境下における日本語母音系列の自動認識(Session-8 ポスターセッション: 一般, 第7回音声言語シンポジウム)
- 音声の構造的表象を用いた雑音環境下における日本語母音系列の自動認識(Session-8 ポスターセッション: 一般, 第7回音声言語シンポジウム)
- 音声の構造的表象を用いた日本語母音系列の自動認識(一般, 一般, チュートリアルレクチャー)
- 音声の構造的表象を用いた日本語母音系列の自動認識
- 言語情報を用いた基本周波数生成過程モデルパラメータ自動抽出の高精度化(合成, 韻律, 生成, 一般)
- 音声の基本周波数パターン生成過程モデルのパラメータ自動抽出法の評価
- 音声の基本周波数パターン生成過程モデルのパラメータ自動抽出法(音声言語情報処理とその応用)
- 基本周波数パターン生成過程モデルのパラメータ自動抽出とその評価
- 1U-9 音声の構造的表象と多段階の重回帰を用いた外国語発音分析(音声分析・強調,学生セッション,人工知能と認知科学,情報処理学会創立50周年記念)
- 単語間の関連性を利用した音声認識用言語モデルのドメイン適応(音声言語情報処理とその応用)
- 単語間の関連性を利用した音声認識用言語モデル
- 音源の空間的な情報の同定に基づく劣決定条件下での音源分離
- 構成要素の分離と統合による単一の混合スペクトルからの音源分離(音響と音声処理・音声強調,ロバスト音声認識,一般)
- 構成要素の分離と統合による単一の混合スペクトルからの音源分離(音響と音声処理・音声強調,ロバスト音声認識,一般)
- 音声の構造的表象に基づく日本語母音系列連続発声の認識(第8回音声言語シンポジウム)
- 音声の構造的表象に基づく日本語母音系列連続発声の認識(Session-4 一般(ポスターセッション),第8回音声言語シンポジウム)
- 音声の構造的表象に基づく日本語母音系列連続発声の認識(Session-4 一般(ポスターセッション),第8回音声言語シンポジウム)
- 音声の構造的表象に基づく発音ポートフォーリオの提案と学習者分類(言語の学習・教育)
- 音声の構造的表象を用いた英語学習話者の分類に関する実験的検討(一般)
- 発音の構造的表象に基づく学習者分類と発音教示生成(一般, STRAIGHTスペシャルセッション(SS))
- 音声の構造的表象に基づく非母語話者の英語発音分析(多言語, CSJ, 認識・理解・対話・一般)
- 音響的普遍構造のサイズと単語境界における音響的分離度に着眼した米語音声の音響分析(音響音声)(音声の基礎と応用シンポジウム)
- 米語母語話者を対象とした日本人英語の聞き取り調査
- 日本語テキスト音声合成を目的としたアクセント結合規則の構築と改良
- 単独ラベラによる大規模アクセントデータベースの構築およびそれを利用した統計的アクセント結合処理の検討(聴覚・音声・言語とその障害,一般)
- 音声聴取時のフィラーの働き : 「エート」による後続句の複雑さ予測
- 英語音素体系を考慮した日本人英語発音のコーパス分析
- DCTとEMDに基づく帯域分割型ソフト閾値法による音声エンハンスメント(信号処理,知的マルチメディアシステム,及び一般)
- DCTとEMDに基づく帯域分割型ソフト閾値法による音声エンハンスメント(信号処理,知的マルチメディアシステム,及び一般)
- DCTとEMDに基づく帯域分割型ソフト閾値法による音声エンハンスメント(信号処理,知的マルチメディアシステム,及び一般)
- 日本人英語発声に観測される発音上の癖を考慮した音声認識(聴覚,音声,言語とその障害)
- 音声の構造的表象に基づく日本語孤立母音系列を対象とした音声認識(音声,聴覚)
- 語彙制約なし音声認識へのアクセント句境界検出の統合
- 語彙制約なし音声認識へのアクセント句境界情報の利用
- モーラを単位とした基本周波数パターンの確率モデル化とそれによるアクセント句境界の検出 (音声言語情報処理)
- 1. 飛躍先端技術の歩み : 1-4 マルチモーダルインタフェース(900号記念特集)
- 経験的モード分解による主構造抽出を介した雑音環境下における音声信号の基本周波数推定
- 経験的モード分解による主構造抽出を介した雑音環境下における音声信号の基本周波数推定
- 自発発話音声認識のための話者内変動を考慮した2段階MLLR適応
- 2000-SLP-32-2 音素ペアモデルによる音素間情報の表現に関する検討
- 音素間相互情報を利用した音素ペアモデルによる話者適応
- 手の動きを入力としたリアルタイム音声生成系における鼻音の合成とピッチ制御に関する検討(福祉と音声処理,一般)
- 日本語音声におけるスペクトル包絡と基本周波数間の依存性に関する定量的分析
- 話者認識技術を利用した主観的高齢話者の同定とそれに基づく主観的年代の推定(音声言語情報処理とその応用)
- 話者認識技術を利用した高齢話者の同定
- 話者認識技術を応用した知覚的年齢分布の自動推定(聴覚,音声,言語とその障害)
- 感情音声合成のための生成過程モデルに基づくコーパスベース韻律生成とその評価(聴覚,音声,言語とその障害)
- 生成過程モデルに基づくコーパスベース感情音声合成とその評価
- 道案内音声対話システムへの概念音声合成に基づく応答生成手法の実装とその評価(音声言語)
- 対話システムにおける応答生成手法の改良とその実装(言語解析, 対話)
- エージェント対話システムにおける対話管理と応答生成
- 2言語の音響モデルを用いた音声認識による非母語発音誤りの検出と発音評価
- 中国語音声基本周波数パターンの2段階合成におけるフレーズ成分の規則ベース生成(合成,生成,韻律,一般)
- 中国語音声基本周波数パターンの2段階合成におけるフレーズ成分の規則ベース生成
- 音調核モデルに基づく中国語F_0パターンの2段階生成(一般, STRAIGHTスペシャルセッション(SS))
- 音調核モデルを用いた中国語F_0パターンの生成(一般, 一般, チュートリアルレクチャー)
- 音調核モデルを用いた中国語F_0パターンの生成
- 構造音韻論の物理実装に基づく新しい音声の音響的表象(音響音声)(音声の基礎と応用シンポジウム)
- 音声合成のためのAR-HMMモデルに基づく音声分析手法の検討
- 波形編集を併用したフォルマント音声合成 : VCV音声に関する検討