特定話者音節HMMの標準偏差補正と無音削除処理による認識率改善(Session-4 一般(ポスターセッション),第8回音声言語シンポジウム)
スポンサーリンク
概要
- 論文の詳細を見る
現在,音声認識においては前後の音素環境を考慮した不特定話者音素HMMを音響モデルとして用いる手法が主流であるが,これらのシステムでは,話者適応化のため長時間のトレーニング用発話が必要であり,音声認識に馴染みのないユーザへの障壁となっている.本報告では,特定話者音節HMMを用いて学習用発話の時間短縮と認識率の確保を試みた結果を述べる.日本語では110個程度の音節で,外来語を含むすべての単語を表現できるので,特定話者音節モデルを採用することで,学習用の発話を数分以内に完了できるという利点がある.その反面,単語発話や連続発話では,音節境界付近の音響パラメータが音節発話の場合とは大きく異なることから,単語数が多くなると認識率の劣化が避けられないという問題点がある.本報告では,音節境界付近の音響パラメータの変形を,音節HMMのパラメータの標準偏差を操作し,さらに無音区間を削除することで吸収し,認識率を改善する手法を提案する.はじめに,音節発話から得られた音節HMMをそのまま適用して認識率を確認し,次に標準偏差を種々の固定値とし,無音区間を削除して学習と認識を行った場合を対象に評価した.その結果,標準偏差を平均値の30%前後に設定すると,単語数20で,1位正解率88%,単語数50では1位正解率76%程度まで改善できることを示した.
- 社団法人電子情報通信学会の論文
- 2006-12-14
著者
関連論文
- 平成20年度 社団法人日本外科学会通常総会
- デュアル入力レベル法(DINPLE法)を用いたオフィス環境における音声の収録(ライフログ活用技術,オフィス情報システム,マルチメディアシステム,マルチメディア通信,IP放送/映像伝送,一般)
- 腹腔鏡下脾臓摘出術を施行した遊走脾の1例
- 1314 大腸癌脾転移の3手術例
- 437 頚部食道胃管吻合部の狭窄および縫合不全に対し食道ステントが奏功した2例
- 279 大腸低分化腺癌手術症例の検討 : 病理組織学的因子に関して
- 左腕頭静脈直下に局在した成熟型嚢胞性奇形腫に対し胸骨挙上法を併用し, 縦隔鏡および胸腔鏡下に切除した1例
- 示II-434 他疾患に併存したPorto-Systemic shuntの4例 : 手術前後の血流動態と肝機能の検討
- R-10 右開胸開腹連続切開法による胸部食道癌根治術
- 子宮転移巣摘出術後に診断された乳癌の1例
- V-119 前縦隔腫瘍に対するラパロリフトを用いた胸骨挙上式縦隔鏡下手術
- 示II-262 大腸癌肝転移症例における胆汁CEA値の検討
- 6 膵頭部動静脈奇形による十二指腸潰瘍からの出血に対し緊急幽門輪温存膵頭十二指腸切除術を施行した1例
- 有茎空膓を用いた食道再建に際しmicrosurgeryによる血管吻合の有用性について
- II-218 傍大動脈リンパ節転移に5 -DFURが奏功した胃癌と大腸癌の2例
- 示I-367 胆嚢癌と慢性胆嚢炎の鑑別困難症例の検討(第52回日本消化器外科学会総会)
- 示I-29 食道肺瘻に対してcovered EMS挿入後に根治手術を施行し得た食道癌の一例(第52回日本消化器外科学会総会)
- 後腹膜原発の明細胞腺癌の1例
- P-778 リンパ節転移陽性乳癌の予後因子 : リンパ節転移状況からの検討
- 甲状腺癌における術前FNAを用いたDNA分析と予後評価の可能性
- I-53.当科における腹腔鏡下胆嚢摘出術に伴う術中胆道損傷の検討(第27回日本胆道外科研究会)
- リンパ節転移陽性乳癌における術後再発の予測 : 再発予知の重回帰式より
- 大動脈二尖弁に伴う大動脈弁閉鎖不全症に対する大動脈弁形成術の1手術例
- 音声認識型電話秘書システムを指向したワードスポッティングに関する検討(一般,ライフログ活用技術,オフィス情報システム,情報通信マネジメント,一般)
- デュアル入力レベル法 (DINPLE法) を用いたオフィス環境における音声の収録
- デュアル入力レベル法(DINPLE法)を用いたオフィス環境における音声の収録(オフィス情報システム,ライフログ活用技術,オフィス情報システム,マルチメディアシステム,マルチメディア通信,IP放送/映像伝送,一般)
- デュアル入力レベル法(DINPLE法)を用いたオフィス環境における音声の収録(オフィス情報システム,ライフログ活用技術,オフィス情報システム,マルチメディアシステム,マルチメディア通信,IP放送/映像伝送,一般)
- 音声認識を適用した電話秘書システムに関する一考察(システム)
- 距離マトリクス画像のハフ変換を用いた単語音声区間検出(ポスターセッション,第10回音声言語シンポジウム)
- 距離マトリクス画像のハフ変換を用いた単語音声区間検出(ポスターセッション,第10回音声言語シンポジウム)
- 距離マトリクス画像のハフ変換を用いた単語音声区間検出(ポスターセッション,第10回音声言語シンポジウム)
- 入力一標準パターン距離マトリクス画像の分析とワードスポッティングへの応用(合成,生成,韻律,一般)
- 始終端特徴パラメータの線形結合による調音結合の分析(一般(ポスターセッション),第9回音声言語シンポジウム)
- 始終端特徴パラメータの線形結合による調音結合の分析(一般(ポスターセッション),第9回音声言語シンポジウム)
- 始終端特徴パラメータの線形結合による調音結合の分析(一般(ポスターセッション),第9回音声言語シンポジウム)
- 特定話者音節HMMの標準偏差補正と無音削除処理による認識率改善(第8回音声言語シンポジウム)
- 特定話者音節HMMの標準偏差補正と無音削除処理による認識率改善(Session-4 一般(ポスターセッション),第8回音声言語シンポジウム)
- 特定話者音節HMMの標準偏差補正と無音削除処理による認識率改善(Session-4 一般(ポスターセッション),第8回音声言語シンポジウム)
- 音声対話システムにおける発話促進プロンプト送出タイミング設計法(音声, 聴覚)
- 同時性食道胃重複癌の検討
- OK-432とミノサイクリンの胸腔内投与が有効であった食道癌切除後の乳糜胸の1例
- 距離マトリクス画像からの直線検出にもとづく電話会話ログ検索 (ライフインテリジェンスとオフィス情報システム)
- 距離マトリクス画像からの直線検出にもとづく電話会話ログ検索
- SY-6-4 重症心不全における再生型治療の基礎研究およびその臨床応用(SY-6 シンポジウム(6)明日の外科医療を構築するための基礎研究,第111回日本外科学会定期学術集会)
- PS-116-3 糖尿病患者のCABGの遠隔成績(PS-116 ポスターセッション(116)心臓:手術-1,第111回日本外科学会定期学術集会)
- PS-118-3 電気的統合性からみたiPS細胞由来心筋細胞シートによる心筋再生効果の検討(PS-118 ポスターセッション(118)心臓:基礎,第111回日本外科学会定期学術集会)
- SF-067-3 重症心不全における新しい細胞移植法の検討 : 細胞シートと大網を用いた大量細胞移植法(SF-067 サージカルフォーラム(67)心臓:基礎,第111回日本外科学会定期学術集会)
- SF-066-3 冠動脈バイパス術後の開心術 : 成績向上を目指して(SF-066 サージカルフォーラム(66)心臓:手術-2,第111回日本外科学会定期学術集会)
- 距離マトリクス画像からの直線検出にもとづく電話会話ログ検索(ログ活用・情報検索,グループウェアとネットワーク,ライフログ活用技術,一般)
- 電話会話ログ検索向け距離マトリクス画像からの直線検出法 (ライフインテリジェンスとオフィス情報システム)
- 距離マトリクス画像中からの直線検出によるワードスポッティング(LD-DMI法)を用いた電話会話ログ検索(音声検索,第13回音声言語シンポジウム)
- 距離マトリクス画像中からの直線検出によるワードスポッティング(LD-DMI法)を用いた電話会話ログ検索(音声検索,第13回音声言語シンポジウム)
- 電話会話ログ検索における再現率と適合率による評価法の検討(ライフログ,情報セキュリティ,ライフログ活用技術,ライフインテリジェンス,オフィス情報システム,一般)
- 電話会話ログ検索における再現率と適合率による評価法の検討(ライフログ,情報セキュリティ,ライフログ活用技術,ライフインテリジェンス,オフィス情報システム,一般)
- 電話会話ログ検索における距離マトリクス画像の2値化しきい値制御(ライフログ,ライフログ活用技術,オフィス情報システム,情報通信マネジメント,一般)
- 電話会話ログ検索における距離マトリクス画像の2値化しきい値制御(ライフログ,ライフログ活用技術,オフィス情報システム,情報通信マネジメント,一般)
- 電話会話ログ検索における距離マトリクス画像の2値化しきい値制御
- 電話会話ログ検索における距離マトリクス画像の2値化しきい値制御
- WS-8-3 肺移植手術における気管・気管支,肺動脈の再建・形成手技の一般呼吸器外科手術への応用(WS-8 ワークショップ(8)肺移植の手術手技から学ぶ一般呼吸器外科への応用)
- PS-108-8 Nipro LVADから埋め込み型LVADへのconversionの有用性の検討(PS-108 心臓 その他,ポスターセッション,第112回日本外科学会定期学術集会)
- PS-107-3 透析症例に対する冠動脈バイパス術の手術成績の検討(PS-107 心臓 虚血性疾患,ポスターセッション,第112回日本外科学会定期学術集会)
- PS-107-1 冠動脈バイパス手術遠隔期成績の検討(PS-107 心臓 虚血性疾患,ポスターセッション,第112回日本外科学会定期学術集会)
- SF-105-6 僧帽弁手術に伴う心房細動に対するMaze手術後のペースメーカー植え込みの危険因子の検討(SF-105 サージカルフォーラム(105)心臓,第112回日本外科学会定期学術集会)
- SF-105-5 慢性透析症例に対する大動脈弁置換術の術前リスク評価 : JapanSCOREの有用性の検討(SF-105 サージカルフォーラム(105)心臓,第112回日本外科学会定期学術集会)
- VWS-1-2 機能性僧帽弁逆流症に対する弁形成術及び乳頭筋間縫縮術 : 心臓CT/MRIによる検討(VWS-1 ビデオワークショップ(1)機能的僧帽弁逆流に対する術式の工夫,第112回日本外科学会定期学術集会)
- VSY-6-4 遠隔成績向上を目指した自己弁温存大動脈基部置換術(reimplantation法)における至適人工血管選択(VSY-6 ビデオシンポジウム(6)大動脈弁形成術および大動脈弁温存手術-適応と術式-,第112回日本外科学会定期学術集会)
- 距離マトリクス画像中からの直線検出によるワードスポッティング(LD-DMI法)を用いた電話会話ログ検索
- 電話会話ログ検索における再現率と適合率による評価法の検討
- 距離マトリクス画像中からの直線検出によるワードスポッティング(LD-DMI法)を用いた電話会話ログ検索
- 電話会話ログ検索における再現率と適合率による評価法の検討
- 電話会話ログ検索向け距離マトリクス画像からの直線検出法(ログ検索とユーザ認証,情報のシステム間流通と信頼性,ライフログ活用技術,オフィス情報システム,一般)
- 音情報を用いたお年寄り見守りシステムの検討(ライフログ活用技術,オフィス情報システム,ビジネス管理,一般)