Dual-SOMの位相構造学習に基づく発話ロボットの自律的音声獲得
スポンサーリンク
概要
- 論文の詳細を見る
This paper presents the method of autonomous voice acquisition for a talking robot by applying a dual-SOM. We have so far developed the talking robot, which has mechanical organs as a human. By applying an auditory feedback control, the robot autonomously learns the vocalization skill. For the autonomous learning method, a Self Organizing Neural Network (SONN) by combining a Self-Organizing Map (SOM) with a Neural Network (NN) was employed. The SONN had 2-dimensional mapping space, which was used to locate phonetic features of voices generated by the robot. By choosing cells on the map, voice articulations were autonomously recreated. However, due to the spatial restriction of the map, the voice transition from one vocal sound to another was not always recreated properly. To solve the problems, a dual-SOM, the combination of a phonetic-SOM and a motor-SOM, both of which have 3 dimensional mapping spaces, is introduced. The structure of the dual-SOM is firstly described, and then acquired vocal sounds are evaluated, together with the analysis of the behavior of the SOM.
著者
関連論文
- 触覚呈示研究を通して見えた触覚の難しさと将来性(平成21年度論文賞の受賞論文紹介)
- 糸状形状記憶合金の振動を利用した高次知覚生起による触覚呈示(ヒューマンインタフェース基礎,インタラクションの理解とデザイン)
- 触覚呈示デバイスを用いたなぞり感覚の呈示
- 触覚呈示デバイスを用いたなぞり感覚の呈示(コミュニケーション支援及び一般)
- 触覚呈示デバイスを用いたなぞり感覚の呈示(コミュニケーション支援及び一般)
- 触覚呈示研究を通して見えた触覚の難しさと将来性
- 形状記憶合金糸を用いた触覚ディスプレイと微小振動の発生確率密度制御による触覚感覚の呈示
- 触覚の高次知覚を利用した振動刺激による触覚呈示
- 2A1-G7 声道物理モデルの聴覚フィードバックによる音響生成(26. Computational Intelligence)
- 食道発声・脳性麻庫患者音声の明瞭化フィルタリングとDSPへの実装(福祉とコミュニケーション)
- 発話ロボットの発話動作獲得と歌声の生成
- スペクトル包絡と調波構造の強調処理による食道発声音声の実時間明瞭化
- 櫛形フィルタによる食道発声音声の実時間明瞭化フィルタリング(福祉情報工学と画像処理、一般)
- 発話ロボットを用いた聴覚障碍者のための発話訓練
- 発話ロボットを用いた聴覚障碍者のための発話訓練(コミュニケーション支援及び一般)
- 発話ロボットを用いた聴覚障碍者のための発話訓練(コミュニケーション支援及び一般)
- 聴覚フィードバックによる発話ロボットの声真似動作の生成(分析、生成と評価)(音声とコミュニケーション及び一般)
- 聴覚フィードバックによる発話ロボットの声真似動作の生成
- 視触覚の同時刺激によるテクスチャ感覚呈示システムの構築とその評価
- Dual-SOMの位相構造学習に基づく発話ロボットの自律的音声獲得
- 微小振動子アレイによる触覚呈示とテクスチャ感覚の評価
- 雑音環境下における音声インタフェース構築のための特定話者のセンシング
- 雑音環境下における特定音響のセンシング
- 人工音声〜声道物理モデルの聴覚フィードバック制御に基づく音声生成(『からだ』と『カラダ』)
- 顔インタフェース構築のための視線・顔部品認識(福祉とコミュニケーション)
- 次世代型生産・流通システムの構築に向けて : 人間中心の感性生産システムへの一提案
- 高齢者・障碍者支援のための画像処理技術
- 力覚および視線により操作可能なモニタデバイスの開発
- マルチモーダル手話データベースとジェスチャを入力としたデータ検索