中間累積距離と音節間類似度を用いた単音節音声認識
スポンサーリンク
概要
- 論文の詳細を見る
日本語音声ワードプロセッサを目的として, 特定の話者が単音節単位に発声した音声の認識方式について論ずる. まず, 単音節の認識方式としては, 中間累積距離マッチング法を提案し, 従来必要とされていた子音・母音境界の正確な抽出なしに, 高い認識精度が得られることを示す. 次に, 発声の変動による認識率の低下に対処するため, 候補音節間の類似度に基づくテンプレートの教師付学習方法を提案する. また, 音声認識部の最終的な出力である候補音節列の最適化を図り, 候補単語数を効果的に削減するためにも, この音節間類似度が有効であることを示す. 実験の結果, 男性話者3名が日本語の68音節を10回発声したデータについて平均認識率95.3%, 第2候補まで含めるならば平均98.0%の認識率を得た. また, 出力候補音節列の最適化を図った場合, 平均98.3%の精度を保ちながら, 候補音節数を平均1.24に削減できた. これは4音節からなる単語を認識対象とする場合, 通常の方法に比べ候補単語数を1/7以下に削減できることを示している.
- 一般社団法人情報処理学会の論文
- 1986-01-15
著者
-
西村 雅史
日本アイ・ビー・エム東京基礎研究所
-
西村 雅史
日本アイ・ビー・エム(株)
-
松田 安弘
日本アイ・ビー・エム会社
-
西村 雅史
日本アイ・ビー・エム(株)サイエンス・インスティチュート
-
松田 安弘
日本アイ・ビー・エム(株)サイエンス・インスティチュート
-
松田 安弘
日本アイ・ビー・エム(株) Dp サービス 大阪 Dp サービス・センター
関連論文
- 音声認識応用に関する学会試行標準
- コーパスベース日本語音声合成フロントエンド (システム開発論文特集)
- 波形重畳型音声合成の韻律と音質のためのF0傾きモデルの利用(音声合成・韻律,第9回音声言語シンポジウム)
- コーパスベース日本語音声合成フロントエンド(音声システム,システム開発論文)
- ユーザの発話傾向分析に基づく車載機器操作のための音声入力手法の検討(音声システム,システム開発論文)
- 単語クラスタリングによる確率的言語モデルの分野適応
- 構造を仮定しない文解釈の一手法
- 講義コーパスを用いた自由発話の大語彙連続音声認識(音声情報処理 : 現状と将来技術論文特集)
- 2000-SLP-32-3 構文構造を反映した確率的言語モデル
- 放送大学コーパスを用いた自由発話の大語彙連続音声認識
- 単語を認識単位とした日本語の大語彙連続音声認識 (音声言語情報処理)
- 音声ワープロ : 過去・現在・未来
- 放送音声の書き起こしに関する検討
- 音声認識・合成によるホームページの閲覧方式
- 単語単位による日本語言語モデルの検討
- ニュース音声書き起こしシステムに関する検討
- 単語を認識単位とした日本語の大語彙連続音声認識
- 7 音声インタフェースの現状とイノベーションの可能性(音声認識技術の実用化への取り組み)
- 音声インタフェースの現状とイノベーションの可能性 (特集 音声認識技術の実用化への取り組み)
- 波形重畳型音声合成の韻律と音質のためのF0傾きモデルの利用(音声合成・韻律,第9回音声言語シンポジウム)
- 波形重畳型音声合成の韻律と音質のためのF0傾きモデルの利用(音声合成・韻律,第9回音声言語シンポジウム)
- 日本語自由発話電話音声からの固有表現抽出
- 長時間スペクトル変動と調波構造に基づく発話区間検出法の音声認識による評価
- [パネルディスカッション]音声認識技術がキャズムを越えるには?
- 日本語生コーパスから自動獲得した未知語と言語モデルによる大語彙連続音声認識([特別セッション]音声言語獲得・学習技術(2), 未知語処理)
- 音声言語インタフェースのための情報処理学会試行標準
- 音声認識読み記号および音声関連ソフトウエアに係わる用語の試行標準案
- 音声言語情報処理に関する情報処理学会の試行標準策定活動
- 音声言語情報処理に関する情報処理学会の試行標準策定活動
- SIG-SLP/SIG-NL合同セッションここまでできるぞ音声/言語処理技術 : 音声編
- ここまでできるぞ音声/言語処理技術 : 音声編
- 音声とテキストを用いた認識単語辞書の自動構築
- 有限要素法による拡散・流動問題の解析 : 第3報, 変形ガレルキン法による非定常二次元粘性流れの解析
- 中間累積距離と音節間類似度を用いた単音節音声認識
- ユーザの発話傾向分析に基づく車載機器操作のための音声入力手法の検討
- 長時間スペクトル変動情報と調波構造特徴量を併用した発話区間検出法(音声認識技術)
- 自動車内音声認識のためのスペクトル サブトラクションとエコーキャンセラの同時適応法
- 講義関連コーパスを利用した音声認識システムの自動適応(音声,聴覚)
- 音声合成のための自動アクセントラベリング(セッション5 : 音声認識+音声合成)
- 音声合成のための自動アクセントラベリング(セッション5 : 音声認識+音声合成)
- N-gramモデルを用いた音声合成のための読みおよびアクセントの同時推定(音声言語,情報処理技術のフロンティア)
- 確率モデルを用いた読み及びアクセント推定(言語解析, 対話)
- 読み上げ韻律との差分を使った強調韻律の学習
- 音声認識ビジネスの現状と将来展望(音声認識のビジネス動向)
- 雑音・残響下音声認識におけるHMM分離・合成法の改良(音響と音声処理,音声強調,ロバスト音声認識)
- 雑音・残響下音声認識におけるHMM分離・合成法の改良(音響と音声処理,音声強調,ロバスト音声認識)
- ハンズフリー音声認識におけるHMM分離法の改良
- 残響下音声認識におけるHMM分離法の改良
- 調波構造と音源方向を利用した音声強調手法の検討
- フレーム単位でのモデル選択による突発性雑音下での音声認識
- 車内音声認識におけるマルチスタイル学習法の効果について
- HMM 合成と遅延和アレーの統合による混合音声の認識
- HMM合成法を用いた混合音声の認識
- IBM電話音声自動応答システム(音声処理技術のデモの紹介)
- 日本語ディクテーションシステムの現状と今後の課題
- 日本語ディクテーションシステムの現状と今後の課題
- 日本語ディクテーションシステムの現状と今後の課題
- 音声認識・理解のための統計的言語処理
- 音声ワープロ最新事情
- 環境汚染問題への有限要素法の応用
- 有限要素法による海域でのコンピュータシミュレーション
- 単語を認識単位とした日本語大語彙連続音声認識
- 単語を認識単位とした日本語ディクテーションシステム
- 人の発声単位を考慮した日本語言語モデルの検討 : 日本語における単語とは
- 単語を認識単位とした日本語ディクテーションシステム
- N-gramを用いた日本語テキストの単語単位への分割
- クラスに基づく言語モデルのための単語クラスタリング
- 離散単語発生による日本語ディクテーションシステムについて
- 日本語Dictation Systemのための統計的言語モデルに関する一考察
- 日本語文音声認識システムを利用した音声圧縮・編集方法の提案
- Decision Treeによる日本語音素環境クラスタリングの検討
- 汎用音声処理カードによる大語彙音声認識
- 有限要素法による拡散・流動問題の解析 : 第2報、前進計算形有限要素法による潮せき運動の解析
- 有限要素法による拡散・流動問題の解析 : 第1報、非定常一次拡散問題への変形ガラーキン法の提案
- 音声データの隠れ属性を利用した異種音響モデル群の構築
- 息継ぎ音を利用した電話音声の発話分割(音声処理,時系列パターン認識)
- 息継ぎ音を利用した電話音声の発話分割(音声処理,時系列パターン認識)
- 息継ぎ音を利用した電話音声の発話分割
- 息継ぎ音を利用した電話音声の発話分割
- 特徴空間における長時間スペクトル変動成分の識別学習
- 大語彙連続音声認識と音節N-best音声認識を用いたSpoken Term Detectionの高精度化