音声対話システムのための発話間の共起性を利用した音声認識結果からの単語取得方法
スポンサーリンク
概要
- 論文の詳細を見る
Nowadays the voice user interface using the automatic speech recognition (ASR) is used for car navigation, tourist's machine translation and information retrieval on the smart phone. Tasks of these applications are well-defined and speakers' high motivation makes them speak clearly. The full equipped domain-limited language models and the clear speaking contribute to the high accurate speech recognition. But in casual conversations, the dialogue domains are not limited and speakers' utterances are not grammatical. This is an ill-defined task for N-gram language model. Latent semantic analysis (LSA) is a technique that can cover long range semantic coherence with semantic relationship between two words in the recognition results. It does not take a word-order into account, so that it is applicable for ungrammatical utterances. It would appear to be effective to use two words with high co-occurrence as correct results, but there is a problem in that a pair of two misrecognized words may have a high co-occurrence. Since a language model such as N-gram applies short range semantic similarities, word pairs with high co-occurrence are frequently recognized together. Our method is a modified LSA. We propose using a word co-occurrence analysis with utterance pairs in order to obtain the appropriate keywords. In a conversation, because speakers talk about one common domain, a user's utterance and a system's last utterance may have high co-occurrence. The system reacts to the recognized words that have high co-occurrence with words in the system's last utterance. We applied this word co-occurrence analysis with utterance pairs to our voice interface robot. The precision rate was 43% in the original recognition system and it was improved to 71% with the word co-occurrence analysis.
著者
-
土井 美和子
(株)東芝
-
小林 優佳
(株)東芝 研究開発センター
-
山本 大介
(株)東芝
-
土井 美和子
(株)東芝 研究開発センター
-
小林 優佳
(株)東芝 研究開発センター
-
山本 大介
(株)東芝 研究開発センター
関連論文
- 11.ヒューマンインタフェース技術の未来 : HIは現在進行形(情報処理技術の未来地図,50周年記念特集号)
- 高齢者対話インタフェース : 『話し相手』となって、お年寄りの生活を豊かに(言語・非言語コミュニケーション〜メタレベルのコミュニケーションへの接近〜)
- 編集にあたって(平成20年度喜安記念業績賞紹介)
- 1F-4 高齢者向け対話インタフェースの開発 : 概念辞書を用いた話題展開法(知的ヒューマンインタフェース,一般セッション,インタフェース)
- ユーザと家電をつなぐロボットインタフェース
- 編集にあたって(平成19年度喜安記念業績賞紹介)
- 5. ロボット位置情報表現の標準化(ネットワークロボット最前線)
- 2. コンピュータの役割に倣うネットワークロボットの将来シナリオ(ネットワークロボット最前線)
- 2D-3 ユーザの音声指示を覚えるインタフェース : 卓上インタフェースロボットへの適用(音声対話・翻訳,一般セッション,人工知能と認知科学)
- B-20-42 ネットワークロボットによる快適目覚ましシステム(B-20. ユビキタス・センサネットワーク,一般セッション)
- 7 人間と教え合うロボットインタフェース(ロボットメディアによる人間情報処理研究)
- 編集にあたって(ロボットメディアによる人間情報処理研究)
- 3.ヒューマンインタフェース研究が与えてくれたダイバーシティ思考(女性たちが拓くIT-ITダイバーシティフォーラムより-)
- 編集にあたって(情報技術が支えるアートとコンテンツの世界)
- ものいふ学会へ(これからの情報処理学会-第23回-)
- 東芝の目指す「きらめきライフ&キャリア」(男女共同参画のページ)
- 編集にあたって(安全と安心のための画像処理技術)
- 3-5 縁は異なもの味なもの(男女共同参画委員会からのメッセージ,学会活動から,エレクトロニクス,情報通信,情報・システム系学生へのメッセージ)
- ユーザの言葉を獲得するロボットインタフェース
- 親和行動導入による実用的ホームロボットインタフェース : 音声誤認識を許容する親和行動
- ユーザの言葉を獲得するロボットインタフェース(コミュニケーション支援及び一般)
- 編集にあたって(工学と芸術を融合する若い息吹)
- 親和行動導入による実用的ホームロボットインタフェースの研究 : ユーザの言葉で操作・通知するインタフェース(誘うインタフェース(3), 誘うインタフェース(Inviting Interface), および一般)
- 3-1 企業におけるヒューマンインタフェース研究者の四半世紀(3. 女性技術者・研究者はこんなことをしています, 女性会員に期待する)
- サービス提供のためのネットワークロボット連携技術
- 編集にあたって(21世紀卓越した情報研究拠点プログラムの目指す研究(後編))
- 編集にあたって
- 編集にあたって(21世紀卓越した情報研究拠点プログラムの目指す研究(前編))
- 環境融和型インタフェースデザイン
- K-095 実用性と親和性を融合するロボットインタフェース : 模倣行動による親和性の検討(K.ヒューマンコミュニケーション&インタラクション)
- 編集にあたって(社会に浸透する新たなコンピュータ/ネットワークの世界)
- No.4 航空運送事業における情報システムの重要性とシステムが担うべきディペンダビリティについて(情報処理で社会を守る)
- No.0 編集にあたって(情報処理で社会を守る)
- 出口を考える
- Raph Koster(著), 酒井,皇治(翻訳), 「おもしろい」のゲームデザイン-楽しいゲームを作る理論, オライリー・ジャパン, 304p., 2,520円(税込), ISBN4-87311-255-9
- 五感情報通信への期待
- 4.読める電子文書(電子出版・電子新聞)
- 情報科学・工学, 私はこう考える : メディアとしての学会誌, 私はこう考える
- 87-24 ウィンドウやスクリーンの認知的配置
- 86-28 文書の構造と整形
- 85-24 人間のコンピュータ使用時の応答時間と表示速度
- 84-38 オンライン・ヘルプ・システムの概要
- 84-33 ソフトウェアの誤りと複雑さ : 経験的調査
- 84-29 ユーザ・インタフェース : その原理と実験
- 84-28 技術文書の文体的難易度と技術者の読解力との整合性の研究
- 84-20 マン・コンピュータ・システムにおけるメタフォの将来
- 84-12 自然なコマンド名と初期 : 学習テキスト編集の場合
- 84-8 初心者プログラマのBASICの誤解症状
- 84-6 遠隔オフィス勤務: 変わりゆく勤務パターン
- 84-1 人間のエラー分析に基づくインタフェースの設計規則
- ロボットインタフェースにおける実用性と親和性の融合機構
- 歩行者の経路への嗜好を反映した経路生成(空間情報応用)(空間情報認知特性の基礎と応用論文)
- 交差点形状が与える心理的影響を考慮した道案内システム(空間認知と経路選択)(空間情報認知特性の基礎と応用論文)
- (4)建物内部の3次元デフォルメ案内図の生成
- K-24 加速度データを用いた行動認識(ヒューマン情報処理(2),K.ヒューマンコミュニケーション&インタラクション)
- ウェアラブルオーサリングシステム
- 高齢者向け対話インタフェース-雑談継続を目的とした話題提示・傾聴の切替式対話法-
- ユーザビリティとインタフェース : ヒューマンインタフェースとWebデザイン(ユーザビリティ)
- ユーザの言葉を獲得するロボットインタフェース(コミュニケーション支援及び一般)
- ユーザの言葉を獲得するロボットインタフェース
- 健康生活を支えるIT技術の動向
- 編集にあたって
- ロボットインタフェースにおける実用性と親和性の融合機構
- ロボットインタフェースにおける実用性と親和性の融合機構(人工現実感)
- カラーおよび奥行き画像のリアルタイム入力 : 奥行き情報にもとづく高速な物体抽出(テーマセッション(3))(ユビキタスコンピューティングのためのパターン認識・理解)
- 空間と情報を横断するユビキタスインタフェース技術(VR,ヒューマンファクタ,一般)
- 空間と情報を横断するユビキタスインタフェース技術(VR,ヒューマンファクタ,一般)
- 死の谷を越えて(ITルネサンスのために : ヒューマンインタフェースの復権を)
- 感動をあなたに(ITルネサンスのために:ヒューマンインタフェースの復権を)
- ITルネサンスのために : ヒューマンインタフェースの復権を : マイノリティ・レポート
- ITルネサンスのために:ヒューマンインタフェースの復権を あなたはデフォルト派ですか,カスタマイズ派ですか?
- ちょっと覚えておいてね(ITルネサンスのために : ヒューマンインタフェースの復権を)
- ユビキタスインタフェースにおけるリアルタイム性と対話距離(人間支援のための分散リアルタイムネットワーク)
- 編集にあたって(人間支援のための分散リアルタイムネットワーク)
- 真のニーズと思い込みニーズ(ITルネサンスのために : ヒューマンインタフェースの復権を)
- 複合現実のユーザインタフェースへの適用
- ユーザからみた「情報」家電(家庭の情報化)
- 実時間ビジョン型インタフェースとペットロボットへの応用
- 環境を身につけるインタフェース技術
- 3次元手姿勢判定によるインタラクション
- 視覚型ペットロボット・インタラクション
- 組み立てて思いのままに動かす : LEGO社Mindstorms^を例に(「実世界に近づくインタフェース技術」)
- 手振りで気持ちを伝えるインタフェース : モーションプロセッサ^(「実世界に近づくインタフェース技術」)
- 編集にあたって(「実世界に近づくインタフェース技術」)
- 5B-4 奥行き距離情報を用いたリアルタイム3次元可視化インタフェース
- モーションインタフェース
- 5J-9 モーションプロセッサ用ソフトウェア開発キット
- 落書き風アニメーションシステム
- ハンドアクションを用いた直感的な情報入力装置
- 3次元画像入力装置とその利用について
- 東芝電子仮想美術館
- 東芝電子仮想美術館
- 東芝電子仮想美術館
- 仮想空間における移動距離把握
- プラント設計支援への仮想環境の適用
- 使いやすいヒューマン・インターフェースの設計
- 仮想空間ナビゲーションのための基礎的研究
- 仮想被験者による操作機器配置評価システム
- VR応用訓練シミュレータ : 機器操作方法について
- VR応用訓練シミュレータ : プロトタイプ : 画像処理・コンピュータビジョン