意味属性を利用したクラスN-gram言語モデルの評価(言語モデル)(第6回音声言語シンポジウム)
スポンサーリンク
概要
- 論文の詳細を見る
一般に,クラスN-gram言語モデルは(1)小規模コーパスで学習ができる,(2)未知語への対策が容易た行えるなどの利点を持つが,認識性能の観点からは改善が少ない.本報告では,日本語語彙大系中の意味属性をクラス情報として用いたクラスN-gram言語モデルの評価結果を報告する.提案方式は(1)学習コーパス中に現れる名詞を,日本語語彙大系を元に意味属性と対応付け,(2)日本語語彙大系に出現しない単語を,分類対象外単語クラスとして一つのクラスにまとめることで,クラスN-gramを構築する.本方式は,体系化された意味属性を用いるため,パープレキシティなどに基づく自動クラスタリングと比較して,モデル構築時間が格段に低減する.評価では,まず,通常の単語N-gramと提案のクラスN-gramモデルとの比較を行う.次に,クラスタリング手法に関する比較検討を行った後,意味属性を初期クラスとした自動クラスタリングの性能評価を行う.提案方式は,対話音声を対象とした音声認識実験で性能を大きく改善すると共に,クラスタリングにかかる厖大な計算を不要とする.
- 社団法人電子情報通信学会の論文
- 2004-12-14
著者
-
桂田 浩一
豊橋技術科学大学大学院工学研究科
-
桂田 浩一
豊橋技科大
-
福田 隆
豊橋技科大
-
山田 博文
豊橋技術科学大学
-
新田 恒雄
豊橋技術科学大学大学院工学研究科知識情報工学専攻
-
山田 博文
岐阜工業高等専門学校電気情報工学科
-
福田 隆
豊橋技術科学大学大学院工学研究科
-
桂田 浩一
豊橋技術科学大学
-
新田 恒雄
豊橋技術科学大学
-
池谷 晴生
豊橋技科大
-
池谷 晴生
豊橋技術科学大学大学院工学研究科
-
山田 博文
岐阜工業高等専門学校 電気情報工学科
関連論文
- マルチモーダル情報処理の研究動向(マルチモーダル)
- 幼児エージェントにおけるバイアスの形成と言語の構造化
- Suffix Arrayを用いた音声文書の高速検索
- ウェブブラウザ上で動作可能なマルチモーダル対話システム(プラットフォーム)
- 音声対話技術コンソーシアム(ISTC)の活動成果報告(SIG-SLP内組織の活動報告)
- 2ZJ-6 動画視聴時の注目点を考慮した動画推薦方法の提案(人間行動,障害等支援,学生セッション,コンピュータと人間社会)
- 3ZA-7 デフォルメ地図の地上座標系へのマッピングを利用した現地情報提供システム(ITSネットワーク・地図情報,学生セッション,ネットワーク)
- DS-2-5 共有信念に基づく発話場面の推定(DS-2. 共生コンピューティング,シンポジウムセッション)
- DS-1-11 Cellプロセッサを用いた音声検索エンジンの高速化(DS-1. COMP-NHC学生シンポジウム,シンポジウムセッション)
- 音声対話システムと質問応答システムの連携による質問応答対話の実現と対話シナリオの検討