環境音を対象とした擬音語自動認識 : 擬音語表現における音素決定曖昧性の解消
スポンサーリンク
概要
- 論文の詳細を見る
Environmental sounds are very helpful in understanding environmental situations and in telling the approach of danger, and sound-imitation words (sound-related onomatopoeia) are important expressions to inform such sounds in human communication, especially in Japanese language. In this paper, we design a method to recognize sound-imitation words (SIWs) for environmental sounds. Critical issues in recognizing SIW are how to divide an environmental sound into recognition units and how to resolve representation ambiguity of the sounds. To solve these problems, we designed three-stage procedure that transforms environmental sounds into sound-imitation words, and phoneme group expressions that can represent ambiguous sounds. The three-stage procedure is as follows: (1) a whole waveform is divided into some chunks, (2) the chunks are transformed into sound-imitation syllables by phoneme recognition, (3) a sound-imitation word is constructed from sound-imitation syllables according to the requirements of the Japanese language. Ambiguity problem is that an environmental sound is often recognized differently by different listeners even under the same situation. Phoneme group expressions are new phonemes for environmental sounds, and they can express multiple sound-imitation words by one word. We designed two sets of phoneme groups: ``a set of basic phoneme group and ``a set of articulation-based phoneme group to absorb the ambiguity. Based on subjective experiments, the set of basic phoneme groups proved more appropriate to represent environmental sounds than the articulation-based one or a set of normal Japaneses phonemes.
- 社団法人 人工知能学会の論文
- 2005-11-01
著者
関連論文
- 音源分離との統合によるミッシングフィーチャマスク自動生成に基づく同時発話音声認識
- 非線形振動子による引き込みを利用した仮想空間における歩行
- ニホンアマガエルの同期した発声行動に関する数理的研究および音響信号解析 (第5回生物数学の理論とその応用)
- 自己組織化回路素子SONEにおけるノイズの抑制
- ミッシングフィーチャー理論を利用した音源分離と音声認識のインターフェースと複数ロボットへの適用
- 視覚情報を話題の対象とする音声対話システム
- 音声版ダイアログナビ : 音声対話によるソフトウェアサポート(音声対話システムB)(テーマ:音声対話システム、音声言語情報処理、一般)
- 音声対話による大規模知識ベース検索システム : 音声版ダイアログナビ(音・音声インタフェース)
- 音声対話によるソフトウェアサポートタスクのための確認戦略
- HTMLのフォーム入力のための文法の自動生成とSALTによる実装
- 柔軟な言語モデルとマッチングを用いた音声によるレストラン検索システム
- 柔軟な言語モデルとマッチングを用いた音声によるレストラン検索システム
- G-007 ミッシングフィーチャー理論による音源分離と混合音声認識の統合型インターフェース(G.音声・音楽)
- 音声対話システムにおける物体指示のための信念ネットワークを用いた曖昧性の解消
- 日本語の音節構造に着目した環境音の擬音語への変換(聴覚・音声/一般)
- 談話標識と話題語に基づく統計的尺度による講演からの重要文抽出
- RNNPBによる視聴覚情報変換を利用したロボットの身体・音声表現(ヒューマンインタラクションとパターン認識・メディア解理・言語理解,ヒューマンインタラクションとパターン認識・メディア解理・言語理解,一般)
- RNNPBによる視聴覚情報変換を利用したロボットの身体・音声表現(ヒューマンインタラクションとパターン認識・メディア理解・言語理解)
- RNNPBによる視聴覚情報変換を利用したロボットの身体・音声表現(ヒューマンインタラクションとパターン認識・メディア理解・言語理解)
- RNNPBによる視聴覚情報変換を利用したロボットの身体・音声表現
- RNNPBによる視聴覚情報変換を利用したロボットの身体・音声表現
- MAHL:演奏者間のインタラクション分析のためのスコアアライメント手法の提案
- ロボットとの音声対話におけるユーザの心的状態の分析
- 家電製品のマニュアルの知識と構造を利用した音声対話ヘルプシステム
- 環境音を対象とした擬音語自動認識 : 擬音語表現における音素決定曖昧性の解消
- バス運行情報案内システムにおけるユーザモデルを用いた適応的応答の生成
- 音声対話システムにおける 簡略表現認識のための自動語彙拡張
- 講演の書き起こしに対する統計的手法を用いた文体の整形
- 講演の書き起こしに対する統計的手法を用いた文体の整形
- 多数話者音声データベースを用いた討論音声の教師なし話者インデキシング