音声認識機能を含むマルチモーダルインタフェースをもつ住所入力システムの開発と評価
スポンサーリンク
概要
- 論文の詳細を見る
本論文では情報入力作業に音声入力を適用することによる入力作業効率の改善について報告する. 我々は評価システムとしてマルチモーダルインタフェースをもつシステムをデスクトップ型端末上に作成した. マルチモーダルインタフェースを音声入力機能と組み合わせることにより, 音声認識の欠点を補い人と機械との効率的で快適なコミュニケーションが期待できる. 今回, 本システムを住所入力に適用し評価実験を行った. 本システムでは住所の入力を音声による方法, 10個単位で候補を表示するメニューから選択する方法および次候補を一つずつ表示させて入力する方法を用いて行うことができる. 評価実験では25人の女性被験者が延べ22,860の住所を入力する作業を行い, うち半数の入力作業で音声入力機能を用いるよう指示した. 実験結果から本システムを用いて入力作業を行う場合には, 音声入力機能を用いることで住所候補数の増加に伴う入力時間の増加傾向を抑制することができ, 操作時間を約12%削減できることがわかった. また本システムでは, 語中ポーズのある音声の認識率が著しく低下することが明らかとなった.
- 社団法人電子情報通信学会の論文
- 1997-05-25
著者
-
嵯峨山 茂樹
NTTヒューマンインタフェース研究所
-
吉岡 理
NTT
-
吉岡 理
NTTヒューマンインタフェース研究所
-
吉岡 理
NTTサイバースペース研究所
-
嵯峨山 茂樹
Nttヒューマンインタフェース研究所:(現)北陸先端科学技術大学院大学
-
管村 昇
Ntt ヒューマンインタフェース研
-
管村 昇
Nttデータ通信株式会社
-
管村 昇
Nttデータ通信(株)
-
荒井 和博
NTTヒューマンインタフェース研究所
-
菅村 昇
Nttデータ通信
-
菅村 昇
(株)nttデータ人材開発部
関連論文
- 教師なし話者適応のための教師信号選択の高精度化
- バッチディクテーションのための教師なし話者適応
- バッチディクテーションのための繰り返し教師なし話者適応
- 音素認識と係り受け解析による文音声の認識 (音声音響情報処理の研究・開発)
- 8)話者認識技術の実用化に向けて(マルチメディア情報処理研究会)
- 話者認識技術の実用化に向けて
- 電話番号案内を対象としたマルチモーダル対話システムの作成と音声入力の評価
- 対話型自動プレゼンテーションシステム
- 自由発話音声における音響的な特徴の検討
- 電話サービスを想定した話者照合
- 自動音声認識の現状と臨床応用の将来性
- テレホンバンキング本人確認の研究
- 雑音の統計的分布を用いた音声区間検出
- HMMを用いた音響演奏の楽譜追跡による弾き直しに追従可能な自動伴奏
- 木構造話者クラスタリングを用いた話者適応
- 話者適応のための木構造話者クラスタリング
- 話者混合逐次状態分割法による不特定話者音声認識と話者適応
- 学習移動ベクトルの相関関係を用いた音響モデルの話者適応化
- 4階層共有構造の音響モデルによる音声認識
- 雑音適応におけるTaylor展開の2次微分項の導入による効果
- 音声認識機能を含むマルチモーダルインタフェースをもつ住所入力システムの開発と評価
- 離散混合分布型HMMにおける量子化方法の検討
- 単語グラフを用いた大語彙連続音声認識における近似演算法
- 大語彙連続音声確認のためのコンパクトな可変長n-gramモデル
- Jacobian適応法による雑音適応の性能評価
- Jacobi行列を用いた音響モデルの適応アルゴリズム
- 音声認識のための音響モデルの構造
- 単語グラフを用いた大語彙連続音声認識における近似演算手法の検討
- 効率的な仮説のマージ機能を持つLRパーザ制御による音声認識
- Taylor展開による音響モデルの適応
- 効率的な仮説のマージ機能を持つLRパーザ制御による音声認識
- Taylor展開による音響モデルの適応
- 音声認識合成による応用構築の容易な電話対話システム
- Taylor展開に基づく高速な音響モデル適応法
- スペクトルサブトラクションとNOVO合成を用いた雑音下音声認識
- 語彙制約なし音声認識における識別誤り最小化学習の検討
- 音響モデルのタスク適応における学習データに関する検討
- ICASSP'96会議報告
- 隠れマルコフ網で表現した音素コンテキスト依存モデルのための話者適応
- 全音素エルゴディック HMM を用いた教師なし話者適応
- 全音素エルゴディック隠れマルコフ網を用いた教師なし話者適応方式
- 逐次状態分割法による隠れマルコフ網の自動生成
- 隠れマルコフ網のための話者適応法
- 双方向網探索によるHMM文節音声認識系の評価
- 音声認識合成による応用構築の容易な電話音声対話システム
- インターネットと音声・オーディオ処理技術
- Delayed Arc EvaluationによるLRパーザ制御に基づくViterbiサーチ
- 逐次クラスタ分割による統計的言語モデル構築法の検討
- 音声認識エンジンVoiceRexの応用--応用事例と適用のコツ (特集 ここまできた音声認識・音声合成)
- 音声認識による住所データ入力時間短縮の効果と不適切発声の認識性能への影響
- マルチモーダルインタフェースを持つ住所入力システムの評価実験
- 音声認識機能を持つ住所入力システム
- 音声入力機能を持つ住所入力システム
- 音声認識機能を持つ住所入力システム
- HMM-LR方式音声認識サーバを用いたマルチモーダル入力
- 語彙制約なし音声認識における音節継続時間長制御の効果
- クライアント・サーバ構成のHMM-LR連続音声認識システムとその応用
- 音素HMMの特定タスクへの適応
- 音節継続時間制御の語彙制約なし認識系での検討
- 自立語と付属語の連鎖統計モデルを用いた音声認識のための候補選択
- 識別誤り最小化を用いた少量データの学習における初期モデルの検討
- 識別誤り最小化を用いた少量データのための効果的なHMM学習法
- 識別誤り最小化と移動ベクトル場平滑化を用いた少量学習データのためのHMM学習法
- 逐次型話者適応方式MAP/VFSにおける分散適応
- 最大事後確率推定と移動ベクトル場平滑化の組合せによる逐次話者・回線適応
- 最大事後確率推定と移動ベクトル場平滑化の組合せによる逐次話者・回線適応
- スペクトルの動的および静的特徴量を用いた言語音声の検出
- 周波数-変動長フィルタによる音声強調
- スペクトログラムのベイジアンノンパラメトリックモデリングに基づく音楽信号の解析
- 時間周波数分解能の異なるスペクトログラムの並列NMFによる多重音解析
- 前向きヒューリスティック関数を用いたビーム探索によるHMM-LR連続音声認識
- スカラー量子化による4階層共有構造HMMの高速計算
- 動的リジェクト機能をもつ前向きヒューリスティック関数によるビーム探索
- 前向き尤度を用いたA^*ビーム探索によるHMM-LR音声認識
- 離散混合出力分布型HMM
- NOVO合成法を用いたBarge-in音声の認識
- 学習移動ベクトル間の相関によりtyingした音響モデルの共有構造
- 4階層共有構造音素モデルにおける分散値共有化の効果
- 周波数-変動長フィルタによる音声強調(聴覚一般,聴覚・音声・言語とその障害/一般)
- HMMを用いたオフライン手書き単語認識における環境クラスタリングとGMMの同時最適化(テーマセッション,文字・文書の認識と理解)
- 音声入力への応答タイミング決定のための強化学習の検討(音声一般・障害者支援,聴覚・音声・言語とその障害/一般)
- 学習移動ベクトル間に相関を持つ音響モデルの共有構造
- 6. 音声認識技術実用への課題 (<解説> 音声言語情報処理の現状と研究課題)
- 音声認識によるマルチモーダルインタラクションへの視点
- 4階層共有構造の音素HMM
- 4階層共有構造の音素HMM
- 楽譜情報からの作曲家らしさ認識のための音楽特徴量の提案
- F0パターン生成過程の確率モデルによる藤崎モデルパラメータの推定
- 多声MIDI演奏の楽譜追跡における演奏の即興性のモデル化と自動伴奏への応用
- 声質空間上での変換に基づく歌声らしさの転写に関する検討
- 楽譜の文脈自由2次元木構造表現に基づく多重音スペクトログラム生成モデルによる音響信号からの自動採譜
- 補助関数法によるMIDI信号の音楽音響信号への詳細なフィッティング
- 確率的手法による歌唱曲の自動作曲(音楽制作と情報処理の友好関係)
- 数理モデルによる音楽情報処理(招待講演,時系列パターン認識)
- 数理モデルによる音楽情報処理(招待講演,時系列パターン認識)
- 入出力隠れマルコフモデルの復号によるギターのための自動編曲
- なぜ音声認識は使われないか・どうすれば使われるか?
- 音楽要素の分解再構成に基づく日本語歌詞からの旋律自動作曲
- 非音声区間情報を用いた補助関数型独立ベクトル分析による音声強調(異種メディア融合,コンテンツ処理,メディア検索,電子透かし,一般)
- 非音声区間情報を用いた補助関数型独立ベクトル分析による音声強調(異種メディア融合,コンテンツ処理,メディア検索,電子透かし,一般)