誤認識時の言い直し発話における発話スタイルの変動に頑健な音響モデル構築法(音声,聴覚)
スポンサーリンク
概要
- 論文の詳細を見る
現行の音声認識システムは100%認識することは難しく,システム利用者は誤認識発生時に言い直しを余儀なくされる.しかしながら,誤認識時の言い直し発話においては利用者は異なる発話様式で発話することが多く,かえって認識性能が劣化するという問題が生じており,誤認識時の言い直し発話に対する頑健性が強く求められている.誤認識時の言い直し発話においては,各音節を強調した発声(音節強調発声)の出現頻度が増加する.本論文では,誤認識時の言い直し発話における音節強調発声に対して頑健な音響モデルの構築方法について提案する.提案手法は,音節強調発声の特徴である,音節間の音響的特徴の変形と,音節間に現れる無音に近い特徴をモデル化するため,先行音素環境依存 biphone 母音モデルと,後続音素環境が無音の triphone 母音モデルを既存の triphone 音響モデルとマルチパス化するものである.デコードの際,ゆう度の最も高くなる母音モデルが選択されるため,音響モデルの切換や認識辞書の拡張を行うことなく,音節強調発声に対して認識性能を改善することが可能となる.評価実験の結果,通常の発話に対して認識性能を劣化することなく,音節強調発声に対して認識性能が改善するとともに,話者適応と併用した場合に更に効果が得られることを確認した.
- 社団法人電子情報通信学会の論文
- 2003-01-01
著者
-
松井 知子
杏林大学医学部衛生学教室
-
松井 知子
Atr音声言語コミュニケーション研究所
-
松井 知子
Atr音声翻訳通信研究所
-
中村 哲
ATR 音声言語コミュニケーション研究所
-
松井 知子
ATR 音声言語通信研究所
-
奥田 浩三
ATR 音声言語コミュニケーション研究所
関連論文
- 実験的急性四エチル鉛中毒の中枢神経系病変について
- P1023 事務系作業者の睡眠不足症候群について : エップワース眠気尺度(ESS)と動脈血酸素飽和度低下指数(4%ODI)による検討
- P1021 CISM実施に際しての留意点と産業保健上の効用 : 新潟県中越地震後のメンタルケア事業の経験から
- I106 救急医師の勤務における交替制と非交替制による労働環境の差異について
- C-20 市中感染症細菌データの地域基幹病院-地区医師会間の共有化システムについての試案(一般口演,第31回杏林医学会総会)
- 連続音声認識候補受理・リジェクションのためのワードスポッティング仮説検証手法(システム・信頼度)(第5回音声言語シンポジウム)
- 住民健診における血清コリンエステラーゼ活性値の意義について : 沖縄県佐敷町における調査成績から
- 救急医師の勤務開始時のストレスと覚醒について : Stress Arousal Checklist (SACL) 日本人版からの検討
- 土木建設作業者の生活習慣と体力測定成績との関連
- 座談会 : 音声研究を語る : (小特集:)
- 高齢者を対象とした音声入力インタフェース評価および対話実験
- 271. 夜間時の運動負荷がその後の昼間睡眠とひき続く回復夜に及ぼす影響 (2) (労働生理)
- 270. 日中時の運動負荷がその後の夜間睡眠に及ぼす影響 (1) (労働生理)
- 46. 警備員の夜勤・交代制勤務に関する調査研究 : (その3) 健康と生活に及ぼす影響について (労働生理)
- 45. 警備員の夜勤・交代制勤務に関する調査研究 : (その2) 生活時間と睡眠時間について (労働生理)
- 44. 警備員の夜勤・交代制勤務に関する調査研究 : (その1) 夜勤・交代制勤務編成上の問題点 (労働生理)
- 警備員の夜勤・交代制勤務に関する調査研究 : 第1報 夜勤・交代制勤務編成上の問題点
- 四エチル鉛中毒に関する実験的研究 : 第 2 報 ラットのオペラント行動に及ぼす影響
- 四エチル鉛中毒に関する実験的研究 : 第 1 報 急性中毒症状の発現状況と自発行動量の変化
- 62. 授産工場における身体障害者の労働負担調査 (労働生理・疲労)
- 49. 夜間時の仮眠が睡眠パターンおよび生理・心理機能に及ぼす影響について (第2報) (労働生理・疲労)
- 48. 夜間時の仮眠が睡眠パターンおよび生理・心理機能に及ぼす影響について (第1報) (労働生理・疲労)
- 強制運動負荷がラットの睡眠に及ぼす影響について〔英文〕
- 17. 全国的系列銀行の健康管理に関する研究 : 健康アンケート調査結果の県別にみた変動要因の分析 (健康管理)
- 警備員の夜勤・交代制勤務に関する調査研究 : 第2報 長時間拘束勤務および残業が生活時間と睡眠時間の変化に及ぼす影響
- 急性四エチル鉛中毒の実験的研究-1-四エチル鉛がラットの睡眠一覚醒サイクルに及ぼす影響について
- 多様な雑音環境下での頑健な音声認識
- 講演音声の音響的特徴分析と音響モデル構築方法の検討
- 旅行会話タスクにおけるTARSPRECの性能評価
- SPINE2プロジェクトのための単語間ポーズモデルによる耐雑音性に優れた音声認識
- SPINE2プロジェクトのための単語間ポーズモデルによる耐雑音性に優れた音声認識
- DARPA SPINEタスクのためのATR音声認識システム
- DARPA SPINEタスクのためのATR音声認識システム
- DARPA SPINEタクスのためのATR音声認識システム
- 地域や年齢的な広がりを考慮した大規模な日本語音声データベース
- 大規模日本語音声データベースの構築と評価
- ATR音素バランスデータベースにおける高精度の音響モデル学習
- SPINE2プロジェクトのための耐雑音性に優れたベースライン音響モデルの構築
- 中国語音韻バランス用文セットの選択手法
- クラスタされた音響モデルによる中国語音声認識
- 大規模な日本語音声データによる音響モデルの分析
- 音響特徴パラメータの相関を利用した音素継続時間長の正規化
- 長時間パワースペクトル減算による雑音下音声認識
- 長時間パワースペクトル減算による雑音下音声認識
- 長時間パワースペクトル減算による雑音下音声認識
- CORBA 用音声翻訳システム
- 口周囲画像による頑強な発話検出
- 口周囲画像による頑強な発話検出
- 口周囲画像による頑強な発話検出
- MDL規準を用いた逐次状態分割法による音響モデル自動構造決定
- MDL規準を用いた逐次状態分割法による音響モデル自動構造決定
- MDL規準を用いた逐次状態分割法による音響モデル自動構造決定
- HMM合成による環境音重畳音声の認識
- 複数トピック分類の信頼度に基づくドメイン外発話の検出(システム・信頼度)(第5回音声言語シンポジウム)
- 複数トピック分類の信頼度に基づくドメイン外発話の検出(第5回音声言語シンポジウム : システム・信頼度)
- 複数トピック分類の信頼度に基づくドメイン外発話の検出(第5回音声言語シンポジウム : システム・信頼度)
- 話題同定に基づく言語モデル切替えによる対話音声認識
- 話題同定に基づく言語モデル切替えによる対話音声認識
- 話題同定に基づく言語モデル切替えによる対話音声認識
- 話題同定に基づく言語モデル切替えによる対話音声認識
- 誤認識時の言い直し発話における発話スタイルの変動に頑健な音響モデル構築法(音声,聴覚)
- 自然発話音声における音節強調発声に頑健な音響モデルの構築法
- 音節強調発声に頑健な自然発話音声の認識法
- 拡張型カルマン・パーティクル・フィルタを用いた雑音下音声認識
- 音節強調発音に頑健な自然発話音声の認識法
- 強制運動負荷がラットの睡眠に及ぼす影響について
- 拡張型カルマン・パーティクル・フィルタを用いた雑音下音声認識
- 拡張型カルマン・パーティクル・フィルタを用いた雑音下音声認識
- マイクロホン対を用いた雑音除去法における空間分解能と演算精度を考慮した最適対選択法
- 急性四エチル鉛中毒の実験的研究 : 第1報 四エチル鉛がラットの睡眠-覚醒サイクルに及ぼす影響について
- ゆう度基準による分析周期・窓長の自動選択手法を用いた発話速度の補正と音響モデルの構築
- 講演音声認識における発話速度の変動を考慮した音声認識手法
- 講演音声認識における発話速度の変動を考慮した音声認識手法
- 講演音声認識における発話速度の変動を考慮した音声認識手法
- スペクトルの時間変化量に基づく可変分析フレームを用いた発話スタイルの変動に頑健な音響モデルの構築
- 音節強調発声に頑健な自然発話音声の認識法
- 自己教示学習を用いた音楽ジャンル分類 : 大規模な音楽データの活用に向けて(Session 7A(Big data))