共通部分単語の提示を併用した単語音声入力インタフェース
スポンサーリンク
概要
- 論文の詳細を見る
大語彙の単語 (キーワード) 入力タスクに対し,認識精度の影響による入力効率の低下を抑えることを目標とした GUI 併用の音声入力インタフェースを提案する.この音声入力インタフェースは,発話の認識結果をもとに生成される複数候補リストを利用者に提示し,そこから利用者が選択する GUI (Graphical User Interface) の仕組みを併用することを前提とする.この様なユーザインタフェースシステムの有効性は認識結果の N-best 候補のみを提示する場合,その有効性は音声認識システムの利用者や環境による認識精度の違いに大きく影響される.我らの方法は,認識性能が高くない悪環境下での入力効率を向上させるため,GUI として提示される複数候補の中に,一般的な認識結果の N-best 候補だけでなく検索 (絞り込み) 候補を含めるアプローチに基づく.検索候補は,事前に定義された共通部分単語と N-best 出力結果から動的に作成される.本稿では,共通部分単語の定義や,表示する候補リストの構成法の違いによる性能比較について報告する.雑音環境を想定した約 13000 語の単語入力タスクに対して評価実験を行った結果,提案するインタフェースは認識結果の N-best 候補のみを提示するベースライン手法を上回る性能を示し,入力の効率が改善された.一方,共通部分単語や構成法の違いはインタフェースの性能に影響を与えるが,いずれもベースライン手法より高い性能を示した.
- 一般社団法人情報処理学会の論文
- 2009-12-14
著者
関連論文
- 文脈情報と応答内容を用いた単語生起確率の動的生成手法に関する検討(セッション3 : 理解るインタフェース : 音声対話)
- 認識信頼度と対話履歴を用いた音声言語理解手法(音声,聴覚)
- 複数の車内機器操作と雑談を扱えるマルチタスク音声対話システムのユーザビリティの向上
- 複数の車内機器操作と雑談を扱えるマルチタスク音声対話システムのユーザビリティの向上
- 文脈情報と応答内容を用いた単語生起確率の動的生成手法に関する検討(セッション3 : 理解るインタフェース : 音声対話)
- 位相情報を利用した話者識別・照合法の評価(ポスターセッション,第10回音声言語シンポジウム)
- 位相情報を利用した話者識別・照合法の評価(ポスターセッション,第10回音声言語シンポジウム)
- 発話位置依存CMNとマルチマイクロフォンアレイ処理の併用による遠隔発話の音声認識(Session-8 ポスターセッション: 一般, 第7回音声言語シンポジウム)
- 位相情報を利用した話者識別・照合法の評価(ポスターセッション,第10回音声言語シンポジウム)
- SIG-SLP/SIG-NL合同セッションここまでできるぞ音声/言語処理技術 : 音声編
- ここまでできるぞ音声/言語処理技術 : 音声編
- カスタマイズ性を考慮した擬人化音声対話ソフトウェアツールキットの設計(音声言語情報処理とその応用)
- 擬人化音声対話エージェント基本ソフトウェアの開発プロジェクト報告(プロジェクト紹介(2))(第5回音声言語シンポジウム)
- 擬人化音声対話エージェント基本ソフトウェアの開発プロジェクト報告(第5回音声言語シンポジウム : プロジェクト紹介(2))
- 擬人化音声対話エージェント基本ソフトウェアの開発プロジェクト報告(第5回音声言語シンポジウム : プロジェクト紹介(2))
- 擬人化音声対話エージェントツールキットGalatea
- 擬人化音声対話エージェント開発プロジェクト
- 擬人化音声対話エージェントツールキットの基本設計
- 擬人化音声対話エージェントツールキットの基本設計
- A-17-20 車の運転状況の認識のための運転行動モデルの検討(A-17.ITS,一般セッション)
- 音声認識における認識単語の競合情報を利用した言語理解と対話制御の構築
- キーワード主体の頑健な音声インタフェースのための韻律的特徴を用いた発話検証
- 頑健な言語理解のための文法とワードスポッティングを併用した音声認識手法の検討(Session-4 システム・言語モデル, 第7回音声言語シンポジウム)
- 頑健な言語理解のための文法とワードスポッティングを併用した音声認識手法の検討(Session-4 システム・言語モデル, 第7回音声言語シンポジウム)
- 頑健な言語理解のための文法とワードスポッティングを併用した音声認識手法の検討(Session-4 システム・言語モデル, 第7回音声言語シンポジウム)
- フォーム型Web情報検索サービスのための音声ユーザインタフェースシステムと操作性の評価(ユーザインタフェース)
- 頑健な意味理解のための音声認識信頼度と対話履歴を利用した発話意図推定手法
- 自然発話文における統計的な意図理解手法の検討
- 車載情報機器との音声言語インタフェースにおける文体統一の効果(ポスターセッション)(第5回音声言語シンポジウム)
- 状況と文脈を利用した音声対話型車載インタフェースの構築と評価(ポスターセッション)(第5回音声言語シンポジウム)
- 車載情報機器との音声言語インタフェースにおける文体統一の効果(第5回音声言語シンポジウム : ポスターセッション)
- 状況と文脈を利用した音声対話型車載インタフェースの構築と評価(第5回音声言語シンポジウム : ポスターセッション)
- 車載情報機器との音声言語インタフェースにおける文体統一の効果(第5回音声言語シンポジウム : ポスターセッション)
- 状況と文脈を利用した音声対話型車載インタフェースの構築と評価(第5回音声言語シンポジウム : ポスターセッション)
- 共通部分単語の提示を併用した単語音声入力インタフェース(一般(ポスターセッション),第11回音声言語シンポジウム)
- 共通部分単語の提示を併用した単語音声入力インタフェース
- 共通部分単語の提示を併用した単語音声入力インタフェース (音声)
- フォーム型情報検索サービスのための音声/ペンタッチ入力インタフェースの比較評価
- 遠隔音声認識のためのマルチチャンネルLMSアルゴリズムによる残響除去法の改善 (音声)
- 遠隔音声認識のためのマルチチャンネルLMSアルゴリズムによる残響除去法の改善 (信号処理)
- 遠隔音声認識のためのマルチチャンネルLMSアルゴリズムによる残響除去法の改善 (応用音響)
- 目的地設定タスクにおける対話状況の違いによる言語・音響的特徴の比較(音声言語情報処理とその応用)
- 同時処理タスクの難易度の変化における言語能力への影響
- 同時処理タスクの難易度の変化における言語能力への影響
- 目的地設定タスクにおける対話状況の違いによる言語的特徴の分析
- 発話位置依存CMNとマルチマイクロフォンアレイ処理の併用による遠隔発話の音声認識(Session-8 ポスターセッション: 一般, 第7回音声言語シンポジウム)
- 発話位置依存CMNとマルチマイクロフォンアレイ処理の併用による遠隔発話の音声認識(Session-8 ポスターセッション: 一般, 第7回音声言語シンポジウム)
- 発話位置依存ケプストラム平均正規化に基づくGMMと話者適応化音節HMMの併用による遠隔発話の話者認識
- 発話位置依存ケプストラム平均正規化による遠隔発話の音声認識と話者認識(一般)
- 発話位置依存ケプストラム平均正規化による遠隔発話の音声認識(認識・理解・対話)
- 発話位置依存ケプストラム平均正規化による遠隔発話の音声認識(認識・理解・対話)
- 任意語彙の追加登録可能な単語音声認識システム
- 音声認識の信頼度と対話履歴を利用した最尤推定型言語理解
- 対話システムにおける音声認識
- 新聞・ニュース文をタスクとした大語彙連続音声認識システムの評価
- 目的地設定タスクにおける訂正発話の特徴分析と検出への応用
- 単語N-gram言語モデルを用いた音声認識システムにおける未知語・冗長語の処理 (音声言語情報処理)
- CFG/bigramを使用した対話音声認識における意味理解の比較検討
- バイグラム言語モデルに基づく対話音声認識における冗長語・未知語処理
- N-gram言語モデルと効率的探索法を用いた大語彙連続音声認識システムの検討
- 1K-6 WWW上のフォーム型音声検索のための音声インタフェースの評価
- WWW上のフォーム型情報検索サービスのための音声インタフェースの検討
- WWWブラウザの音声操作システムとその評価
- 音声認識サーバ-SPOJUS-を利用したWWWブラウザの音声操作システム
- 遠隔音声認識のためのマルチチャンネルLMSアルゴリズムによる残響除去法の改善(オーガナイズドセッション:スピーチエンハンスメント,音声・音響信号処理,音声及び一般)
- 遠隔音声認識のためのマルチチャンネルLMSアルゴリズムによる残響除去法の改善(オーガナイズドセッション:スピーチエンハンスメント,音声・音響信号処理,音声及び一般)
- 遠隔音声認識のためのマルチチャンネルLMSアルゴリズムによる残響除去法の改善(オーガナイズドセッション:スピーチエンハンスメント,音声・音響信号処理,音声及び一般)
- 新聞・ニュース文の大語彙連続音声認識
- 新聞・ニュース文の大語彙連続音声認識
- 2-C-4 Least distance based inefficiency measures on the Pareto-efficient frontier
- 音声対話制御のためのHIS-POMDP学習・評価プロトタイプツールの開発 (一般セッションと「法と社会のインタフェース」関する特別セッション)
- 音声認識誤り率の推定を用いたPOMDPモデルの構築の検討 (一般セッションと「法と社会のインタフェース」関する特別セッション)
- SS法に基づく雑音残響除去法の実環境下における評価 (音声)
- SS法に基づく雑音残響除去法の実環境下における評価 (応用音響)
- SS法に基づく雑音残響除去法の実環境下における評価 (信号処理)
- 単語断片の候補選択が可能な音声入力インタフェースの実装と評価 (言語理解とコミュニケーション)
- 単語断片の候補選択が可能な音声入力インタフェースの実装と評価 (音声)
- 最短距離DEAによるプログラムコンテスト「敢闘賞」の決定(ランキングとレイティング)
- 単語断片の候補選択が可能な音声入力インタフェースの実装と評価(話者照合・音声認識,第13回音声言語シンポジウム)
- 単語断片の候補選択が可能な音声入力インタフェースの実装と評価(話者照合・音声認識,第13回音声言語シンポジウム)
- 最短距離DEAによるプログラムコンテスト「敢闘賞」の決定
- SS法に基づく雑音残響除去法の実環境下における評価(一般,音声・音響信号処理,音声及び一般)
- SS法に基づく雑音残響除去法の実環境下における評価(一般,音声・音響信号処理,音声及び一般)
- SS法に基づく雑音残響除去法の実環境下における評価(一般,音声・音響信号処理,音声及び一般)
- SS法に基づく雑音残響除去法の実環境下における評価