連続日本語音声認識における単語・文節間コンテキストのクラスタ化手法
スポンサーリンク
概要
- 論文の詳細を見る
This paper investigates methods to model inter-phrase or word context for continuous Japanese speech recognition. It is well known that in continuous speech, coarticulation between words or phrases induces allophonic variation of the beginning and ending phones in words or phrases. It was found that by compiling a network of context-dependent phonetic models which models these inter-word or inter-phrase context, recognition error reduction by 32% can be achieved compared to models which do not account for inter-word context with task-dependent training, i. e. models that were trained with the same vocabulary as the test set. A more dramatic error reduction of up to 43% was possible with task-independent training. However, this will significantly increase the number of phonetic models required to model the vocabulary. With digit models, the increase in the number of models is 4 to 5 fold. To overcome this increase, we clustered the inter-word/phrase context into a few phonetic classes. Using one class for consonant inter-word context and two classes for vowel context, the recognition accuracy on digit string recognition was found to be virtualluy equal to the accuracy with unclustered models, while the number of phonetic models required was reduced by more than 50%.
- 社団法人日本音響学会の論文
著者
-
近藤 和弘
山形大学大学院理工学研究科
-
近藤 和弘
Texas Instruments Tsukuba Research And Development Center Ltd.
-
高 毓宏
Systems and Information Science Laboratory,Texas Instruments Inc.
-
ウィトリー バーバラ
Systems and Information Science Laboratory,Texas Instruments Inc.
-
高 毓宏
Systems And Information Science Laboratory Texas Instruments Inc.
-
ウィトリー バーバラ
Systems And Information Science Laboratory Texas Instruments Inc.
関連論文
- ADPCM符号化方式に適用可能なデータ埋込方式の検討(音声,聴覚)
- ステレオ符号化が仮想3次元空間音声の音声了解度へ与える影響
- ステレオ符号化が仮想3次元空間音声の音声了解度へ与える影響 (応用音響)
- B-11-27 マルチメディア・コンテンツにおいて音声の相対的遅延が短期記憶に与える影響(B-11.コミュニケーションクオリティ,一般セッション)
- ステレオ符号化が仮想3次元空間音声の音像定位精度に与える影響(聴覚・音響信号処理/一般)
- ステレオ符号化が仮想3次元空間音声の音像定位精度に与える影響
- 二者択一型日本語音声了解度試験方法の検討
- 光ファイバを用いた光FIR型フィルタの基礎実験
- EA2010-23 ステレオ符号化が仮想3次元空間音声の音声了解度へ与える影響
- カーナビゲーション音声の明瞭度向上の検討
- 光ファイバを用いた光FIR型フィルタの基礎実験
- 光ファイバを用いた光FIR型フィルタの基礎実験(アクセス系,光無線システム,光映像伝送,光通信,オペレーション/保守監視,一般)
- 二者択一式日本語了解度試験方法の評定用リストの再検討
- 高圧縮付加データを用いたMPEGオーディオ符号伝送欠落の品質向上方式
- B-10-62 信号レベル遷移形状が光SSB伝送のSPM効果に与える影響(B-10.光通信システムB(光通信),一般講演)
- B-10-55 光SSB伝送のSPM効果に関する光FIRヒルベルト変換器分岐比設計法の検討(B-10.光通信システムB(光通信), 通信2)
- 光単側波帯変調信号のファイバ非線形による自己位相変調効果(適応制御・計測技術, 高効率FEC技術, パフォーマンスモニタリング技術, 一般)
- 放射音声の能動制御の評価
- 高圧縮付加データを用いた符号化音響信号劣化の品質向上方式
- 放射音声の能動制御における長期予測の一検討
- B-6-57 利用波長数を最適化した VWP ネットワークの自己回復特性
- 光信号処理型ヒルベルト変換器を適用した光SSB変調波長多重系のアイ開口解析
- 4-12 HDTVディジタルVTR用画像符号化方式の一検討
- 連続日本語音声認識における単語・文節間コンテキストのクラスタ化手法
- 608 車内騒音環境下における圧電スピーカの音声明瞭度
- 352 圧電スピーカの音響放射特性がカーナビ音声の了解度に及ぼす影響
- 電気段低域減衰等化器を適用した有限次数ヒルベルト変換型光SSB変調波長多重系のアイ開口解析
- B-10-131 光ヒルベルト変換器を用いたSSB変調光伝送方式によるアイ開口特性シミュレーション
- B-10-143 ヒルベルト変換器を用いた光 SSB 変調特性
- パケット欠落による符号化音響信号劣化の品質向上方式と評価
- 6-4 インタリービングを利用したパケット欠落による符号化音響信号劣化の品質向上方式
- 広帯域騒音制御に適応可能な帯域分割適応予測方式の研究
- 新しい日本語了解度試験方法の評価
- 日本語の了解度試験方法改良の評価
- 日本語了解度試験における親密度の影響
- 日本語明瞭度試験方法改良の一検討
- B-10-131 狭帯域光変調方式のファイバ波長分散耐性に関する検討
- 光SSB-SC方式の高分散ファイバ伝送におけるアイ開口特性シミュレーション
- 光SSB-SC方式の高分散ファイバ伝送におけるアイ開口特性シミュレーション
- B-10-164 光SS8-SC変調方式の高分散光ファイバ伝送特性シミュレーション
- 601 シェル型圧電スピーカを応用したカーナビ用音声アノテーションの検討(OS-B ダイナミクス一般,ダイナミクスに関する新技術,総合テーマ「伝統を,未来へ!」)
- SP2000-37 新しい日本語明瞭度試験方法の基礎検討
- D-21-9 音響電子透かし技術の評価基準と評価コンテスト(D-21.マルチメディア情報ハイディング・エンリッチメント,一般セッション)
- 音響信号に対する情報ハイディング及びその評価基準の検討(異種メディア融合,コンテンツ処理,メディア検索,電子透かし,一般)
- 音響信号に対する情報ハイディング及びその評価基準の検討(異種メディア融合,コンテンツ処理,メディア検索,電子透かし,一般)
- 客観的評価値を用いたデータを埋め込んだ音響信号品質の推定の基礎検討 (マルチメディア情報ハイディング・エンリッチメント)
- 客観的評価値を用いたデータを埋め込んだ音響信号品質の推定の基礎検討 (応用音響)
- 音響信号に対する情報ハイディング及びその評価基準の検討
- E-020 仮想音響空間内の音声了解度推定に用いるひずみ尺度の検討(音声言語処理,E分野:自然言語・音声・音楽)
- 第1回音響電子透かしコンテスト実施結果とその講評(異種メディア融合,コンテンツ処理,メディア検索,電子透かし,一般)
- 客観的評価値を用いたデータを埋め込んだ音響信号品質の推定の基礎検討(異種メディア融合,コンテンツ処理,メディア検索,電子透かし,一般)
- 第1回音響電子透かしコンテスト実施結果とその講評(異種メディア融合,コンテンツ処理,メディア検索,電子透かし,一般)
- 客観的評価値を用いたデータを埋め込んだ音響信号品質の推定の基礎検討(異種メディア融合,コンテンツ処理,メディア検索,電子透かし,一般)
- 音声了解度の客観推定に用いる騒音クラスタリングとその性能評価