階層化言語モデルによる音声ドキュメントの検索(言語モデル)
スポンサーリンク
概要
- 論文の詳細を見る
本稿では、音声ドキュメントに対するキーワード検索について、階層的言語モデルを用いたラティス構造をインデックスに利用する検索手法を提案する。階層的言語モデルは、音声ドキュメントの認識、および検索のインデクシングにおいて利用し、階層は、二階層から構成されている。上位の階層は、既知の単語からなる従来のクラスn-gramの階層であり、下位の階層は、日本人名および地名の、未知語を処理するためのサブワードn-gramの階層である。認識結果として扱うラティスには、未知語のタイプやその候補の位置情報を利用し、FSAにより枝狩りされたサブワード列から構成される未知語が含まれる。このようなラティスを簡潔に表現する一つであるconfusion network (CN)を用いたインデクシング処理を行うことにより、既知語、未知語を同時に処理できる手法となっている。検索の評価は、既知語および未知語を含むものとして評価した。実験結果として、この階層的モデルが認識辞書に未登録の日本人の人名や地名を効果的に検出した。また,既知語の効率は、従来のクラスn-gram手法に比較して、ほとんど変化しておらず、悪影響はみられなかった。
- 一般社団法人情報処理学会の論文
- 2008-07-11
著者
関連論文
- 京都観光案内対話コーパスにおける対話行為タグの設計と分析(理解)
- 同調的対話システム構築のための音声対話コーパスの構築(「ユニバーサルコミュニケーションを実現するための言語処理技術」シンポジウム)
- SLP音声ドキュメント処理ワーキンググループ活動報告(ドキュメント処理・翻訳・言語獲得,第10回音声言語シンポジウム)
- 統計的対話モデルを用いたWFSTに基づく音声対話システム
- 同調的対話を実現するプロトタイプシステムの開発(対話・インタフェース・インタラクション)
- 音声認識の信頼度・複数候補を利用したWFST対話システムの評価
- SLP音声ドキュメント処理ワーキンググループ活動報告(ドキュメント処理・翻訳・言語獲得,第10回音声言語シンポジウム)
- SLP音声ドキュメント処理ワーキンググループ活動報告(ドキュメント処理・翻訳・言語獲得,第10回音声言語シンポジウム)
- 相談型対話のモデル化と対話戦略の最適化
- 用例ベース翻訳の確率的モデル化
- 対話者の社会的役割を利用した訳し分け手法
- 階層化言語モデルによる音声ドキュメントの検索(言語モデル)
- Confusion Networkを用いた音声ドキュメントの検索及び評価に関する研究
- 4.ライフログに基づく実世界でのコンテンツ利活用(ライフログ)
- 用例ベース翻訳のための日英アライメント確信度語類似度を用いた訳語選択
- 意志決定を支援する音声対話システムの構築と評価
- 音声対話型観光案内システムにおける誤応答リカバリー効果の評価
- 言語獲得ロボットによる発話理解確率の推定に基づく物体操作対話
- Web時代の音声・言語技術
- ネットワーク型音声対話システム開発ツール : WFSTDMビルダー(音声対話,認識,理解,対話,一般)
- 観光案内への音声対話システムの活用
- 音声対話による観光案内システムの開発と多言語化 : 音声対話システムAssisTraの研究開発から得られた知見と課題(音声対話システムの実用化に向けて)