Selection of Optimum Vocabulary and Dialog Strategy for Noise-Robust Spoken Dialog Systems
スポンサーリンク
概要
- 論文の詳細を見る
Speech recognition in a noisy environment is one of the hottest topics in the speech recognition research. Noise-tolerant acoustic models or noise reduction techniques are often used to improve recognition accuracy. In this paper, we propose a method to improve accuracy of spoken dialog system from a language model point of view. In the proposed method, the dialog system automatically changes its language model and dialog strategy according to the estimated recognition accuracy in a noisy environment in order to keep the performance of the system high. In a noise-free environment, the system accepts any utterance from a user. On the other hand, the system restricts its grammar and vocabulary in a noisy environment. To realize this strategy, we investigated a method to avoid the users out-of-grammar utterances through an instruction given by the system to a user. Furthermore, we developed a method to estimate recognition accuracy from features extracted from noise signals. Finally, we realized a proposed dialog system according to these investigations.
- (社)電子情報通信学会の論文
- 2008-03-01
著者
-
伊藤 彰則
東北大
-
Ito A
Graduate School Of Engineering Tohoku University
-
伊藤 彰則
東北大学
-
Akinori Ito
Graduate School Of Engineering Tohoku University
-
Makino S
Graduate School Of Engineering Tohoku University
-
Makino Shozo
Graduate School Of Engineering Tohoku University
-
ITO Akinori
Department of Applied Chemistry, Graduate School of Engineering, Nagoya University
-
Oba Takanobu
Department of Geoscience
-
Ito Akinori
Education Center For Information Processing Tohoku University
-
Ito Akinori
Graduate School Of Engineering Tohoku University
-
Ito Akinori
Department Of Applied Chemistry Graduate School Of Engineering Nagoya University
-
Oba Takanobu
Department Of Electrical And Communication Engineering Graduate School Of Engineering Tohoku Univers
-
Suzuki Motoyuki
Institute Of Technology And Science The University Of Tokushima
-
KONASHI Takashi
Department of Electrical and Communication Engineering, Graduate School of Engineering, Tohoku Unive
-
SUZUKI Motoyuki
Department of Electrical and Communication Engineering, Graduate School of Engineering, Tohoku Unive
-
MAKINO Shozo
Department of Electrical and Communication Engineering, Graduate School of Engineering, Tohoku Unive
-
Konashi Takashi
Department Of Electrical And Communication Engineering Graduate School Of Engineering Tohoku Univers
-
Suzuki Motoyuki
Department Of Civil Engineering Tohoku University
-
伊藤 彰則
Graduate School of Engineering, Tohoku University
-
SUZUKI MOTOYUKI
Department of Chemical Engineering, University of Tokyo
関連論文
- 局所変化率変換と時間軸変換に基づく有声音声の正弦波モデル(音声,聴覚)
- 日本人英語発話からの文法誤り検出
- 確率的言語モデルに基づく音声ドキュメント検索のためのWebを利用したモデル拡張の検討 (音声)
- 確率的言語モデルに基づく音声ドキュメント検索のためのWebを利用したモデル拡張の検討 (言語理解とコミュニケーション)
- 確率的言語モデルに基づく音声ドキュメント検索のためのWebを利用したモデル拡張の検討
- 歌唱の「熱唱度」評価の検討
- 複数F0候補を用いた音楽音響信号からのハミング楽曲検索
- K_088 ロボットアバタを用いたユーザ親和性向上手法の高齢者による評価(K分野:ヒューマンコミュニケーション&インタラクション)
- 3116 人間の手助けとなる機能を有するロボット IRIS の開発
- SIG-SLP/SIG-NL合同セッションここまでできるぞ音声/言語処理技術 : 音声編
- ここまでできるぞ音声/言語処理技術 : 音声編
- 監視マイクロホンのための多段GMMを用いた異常音検出手法(テーマセッション,福祉と見守りのための画像・音声処理)
- 監視マイクロホンのための多段GMMを用いた異常音検出手法(テーマセッション,福祉と見守りのための画像・音声処理)
- 監視マイクロホンのための多段GMMを用いた異常音検出手法(テーマセッション,福祉と見守りのための画像・音声処理)
- 連続音声認識コンソーシアム2002年度版ソフトウエアの概要
- 連続音声認識コンソーシアム2001年度版ソフトウエアの概要
- 日本語ディクテーション基本ソフトウェア(99年度版)
- 2000-NL-137-7 / 2000-SLP-31-2 日本語ディクテーション基本ソフトウェア(99年度版)の性能評価
- 2000-NL-137-7 / 2000-SLP-31-2 日本語ディクテーション基本ソフトウェア(99年度版)の性能評価
- 日本語ディクテーション基本ソフトウェア : 97年度版
- 日本語ディクテーション基本ソフトウェア(97年度版)
- 日本語ディクテーション基本ソフトウェア(97年度版)の性能評価
- 連続音声認識コンソーシアム2000年度版ソフトウエアの概要と評価
- 新博士によるパネルディスカッションIII 「私のための研究・価値を生み出す研究」
- Recent Decline of Atmospheric Concentration and Emission of Methane in Nagoya Metropolitan Area
- 大語彙日本語連続音声認識研究基盤の整備 : 汎用音素モデルの作成
- 大語彙日本語連続音声認識研究基盤の整備 : 学習・評価テキストコーパスの作成
- 大語彙日本語連続音声認識研究基盤の整備 : 評価用連続音声認識プログラムの開発
- Mineralogy and petrology of chondrule in Ouallen (Tanezrouft) meteorite
- 「人はなぜコンピューターを人間として扱うか『メディアの等式』の心理学」, バイロン・リーブズ, クリフォード・ナス著, 細馬宏通訳, 翔泳社, 2001年(私のすすめるこの一冊,コーヒーブレーク)
- 日本語ディクテーション基本ソフトウェア(97年度版)の性能評価
- G-014 鼻歌入力による音楽検索のための特徴量の比較(G.音声・音楽)
- Radial cordierite-bearing orbicular granite formed from the melting of pelitic hornfels in granitic magma, Tsukuba Mountains, Japan
- 自然対話映像における表情認識を利用した笑い認識に関する研究
- Stability Analysis of Continuous Culture in Diauxic Growth
- Development of a toxicity evaluation system for gaseous compounds using air-liquid interface culture of a human bronchial epithelial cell line, Calu-3
- Development of a Simple Double-layered Cell Culture System Using Caco-2 and TIG-1 Cells as a New Cytotoxicity Test
- A New Assay for Evaluating Hepatotoxicity and Cytotoxicity Using LDL-Uptake Activity of Liver Cells
- Rapid and Sensitive Neurotoxicity Test Based on the Morphological Changes of PC12 Cells with Simple Computer-Assisted Image Analysis
- ATTACHMENT KINETICS OF ANIMAL CELLS IMMEDIATELY AFTER CONTACT ONTO SPECIFIC AND/OR NON-SPECIFIC SURFACES
- The mineral assemblage of symplectites in lunar meteorite Asuka-881757
- Improved Reference Speaker Weighting Using Aspect Model
- Bit rate reduction of mixed excitation linear prediction coder by Lempel-Ziv segment quantization
- Selection of Optimum Vocabulary and Dialog Strategy for Noise-Robust Spoken Dialog Systems
- Pronunciation error detection for computer-assisted language learning system based on error rule clustering using a decision tree
- An Evaluation Method of Japanese Pronunciation for Korean Native Speakers
- I-069 Smile and Laugh Recognition from Natural Conversation Video
- A New HMnet Construction Algorithm Requiring No Contextual Factors
- Information Hiding for G.711 Speech Based on Substitution of Least Significant Bits and Estimation of Tolerable Distortion
- Source-filter separation for nonstationary voiced speech based on sinusoidal representation
- Fast optimization of language model weight and insertion penalty from n-best candidates
- 統計的言語モデルを用いた作詞補助システム
- MICROSTRUCTURE OF PERTHITES IN SYENITES FROM THE YAMATO MOUNTAINS, EAST ANTARCTICA
- 東日本大震災 危機発生時の対応について考える:12.東日本大震災時の東北大学工学研究科の対応
- METHOD OF EVALUATING EARTHQUAKE SAFETY OF RC BRIDGE SYSTEM BASED ON RELIABILITY THEORY
- EXPERIMENTAL STUDY OF THE SYENITIC ROCKS FROM THE YAMATO AND SOR RONDANE MOUNTAINS, EAST ANTARCTICA
- MINERALOGY OF THE SYENITIC ROCKS FROM THE YAMATO AND THE SOR RONDANE MOUNTAINS, EAST ANTARCTICA
- EXPERIMENTAL STUDIES ON SYENITIC ROCKS IN THE YAMATO MOUNTAINS, EAST ANTARCTICA
- Speech Recognition under Multiple Noise Environment Based on Multi-Mixture HMM and Weight Optimization by the Aspect Model
- The Performance Prediction on Sentence Recognition Using a Finite State Word Automaton
- Note on rock-forming minerals in the Joetsu district, Niigata Prefecture, Japan. (12) : Magnesio-arfvedsonite from the Omi district
- THE STABILITY FIELD OF AMPHIBOLE FROM THE S∅R RONDANE MOUNTAINS, EAST ANTARCTICA : IMPLICATION FOR THE EMPLACEMENT DEPTH OF SYENITE MAGMA
- THE EMPLACEMENT PRESSURE OF SYENITE ESTIMATED FROM THE STABILITY FIELD OF AMPHIBOLE FROM THE YAMATO MOUNTAINS, EAST ANTARCTICA
- Novel Tonal Feature and Statistical User Modeling for Query-by-Humming
- ロボットの主観評価における身体と拡張現実感(一般,『コミュニケーションの身体を捉える』及び一般)
- Note on rock-forming minerals in the Joetsu district, Niigata Prefecture, Japan. (10) Pectolite from the Omi district.
- Experimental estimation of emplacement depth of granitic dikes from the Sor RondaneMountains, East Antarctica
- Note on rock-forming minerals in the Joetsu district, Niigata Prefecture, Japan. (11) Chromian andradite from the Kotaki district.
- Experimental study of the syenitic rocks from the Yamato and Soer Rondane Mountains, East Antarctica (abstract)
- Note on rock-forming minerals in the Joetsu district, Niigata Prefecture, Japan. (13) Tremolite-actinolite from the Kotaki-Omi district.
- A grammatical error detection method for dialogue-based CALL system
- 5 What Can be Done for Cardiovascular Medicine Using Robotics and Information Technologies?(Robotics and Information Technologies (IT) in the Field of Cardiovascular Medicine,Plenary Session 6 (PL6) (H),The 70th Anniversary Annual Scientific Meeting of th
- 音声対話システムのための非言語情報を用いた発話前状態の推定(音声対話,認識,理解,対話,一般)
- 2A2-A21 日常生活支援移動ロボットGoyaneの開発
- Automatic Determination Algorithm for Optimum Number of States in Discrete-Type HMnet
- 2A2-A22 日常生活支援移動ロボットのためのロボットアバタを用いた動作予告法の比較
- ロボットの動作によって人間の発話開始時間を制御できるか?
- 質問応答データベースを用いた聞き返し発話の検出に関する検討
- 統計的言語モデルを用いた作詞補助システムのための歌詞特徴に関する検討
- 付加情報を用いたボーカル音声操作システムにおける伴奏情報の適用方法の検討(臨場感生成,ユニバーサルメディア,ディジタルエンタテインメント,一般)
- 非言語情報を用いたHMMによるユーザ発話前内部状態の推定(テーマセッション,時系列パターン認識)
- 非言語情報を用いたHMMによるユーザ発話前内部状態の推定(テーマセッション,時系列パターン認識)
- Geographic differences in the increasing ESRD rate have disappeared in Japan
- 対話中のユーザ状態逐次推定のための多段階識別手法に関する検討
- 対話中のユーザ状態逐次推定のための多段階識別手法に関する検討
- Robust Transmission of Audio Signals over the Internet: An Advanced Packet Loss Concealment for MP3-Based Audio Signals
- 非言語情報を用いたHMMによるユーザ発話前内部状態の推定
- Low birth weight and end-stage renal disease : demographic analysis by region in Japan
- 拡張現実感を用いたロボットデザインの評価
- Novel Tonal Feature and Statistical User Modeling for Query-by-Humming
- Novel Tonal Feature and Statistical User Modeling for Query-by-Humming
- 音声言語情報処理研究会の20年-歴代主査による研究レビュー-
- Foreword to the special issue on ``the speech communication and its related technologies''
- グロウル・スクリーム歌唱音声の音響的特徴と聴覚印象の考察(オーガナイズドセッション「多様な音声・歌声の合成に向けて」,音声・言語・対話,一般)
- 2P2-Q08 日常生活支援移動ロボットGoyaneの開発 : 高さ変更可能な機構の提案(インフォマティブ・モーションとモーション・メディア-ロボットの身体性と運動-)
- アマチュア歌唱エンタテインメントのための熱唱度評価システムSEES
- 対話ターン中のユーザ状態の推定に有用なモダリティの分析(オーガナイズドセッション)
- 拡張現実感を用いたロボットデザインの評価
- Robust Transmission of Audio Signals over the Internet: An Advanced Packet Loss Concealment for MP3-Based Audio Signals ( Fundamental Aspects and Recent Developments in Multimedia and VLSI Systems)