ニューラルネットワークによる話者認識
スポンサーリンク
概要
- 論文の詳細を見る
音声スペクトルの概形の時間変化を入力として, 階層型のニューラルネットを用いた話者認識(話者同定および話者照合)を行った.話者5人について, 1単語(/tadaima/)を用いて入力の帯域分割数と区間分割数(時分割)を変化させて, 認識率を求めた.話者同定では, linear 4ch程度のごく簡単なスペクトル概形でも, 時間情報を入れることにより, 1〜21週の時期差があるデータを完全に同定できた.話者照合については, 照合率94.1%と時期差の影響は吸収しきれなかった.また, 中間層のユニット数を変化させて, ネットワークの性能と, 中間層の内部表現について調べた.さらに, テキストに依らない話者同定を試みた.時間情報を除き, 複数単語を用いて学習を行うことにより, 発声内容による影響を減らすことができ, 同定率91.3%を得た.
- 社団法人映像情報メディア学会の論文
- 1990-06-20
著者
-
麻生 英樹
電子技術総合研究所
-
小池 恒彦
NTTアドバンステクノロジ
-
海野 雅幸
積水化学工業(株)筑波研究所
-
海野 雅幸
積水化学工業株式会社応用電子研究所
-
西村 新吾
積水化学工業株式会社応用電子研究所
-
小池 恒彦
Nttアドバンステクノロジ株式会社
関連論文
- コンピュータとの対話におけるユーザの振舞いの解析
- パワーエンベロープ伝達関数の逆フィルタ処理による残響音声の回復
- 剛球による散乱音場の位相特性
- 球体による散乱音場の位相特性
- 最小位相成分とパワーエンベロープに着目した残響音場における音源波形回復
- 41165 浴室衣類乾燥における乾燥時間予測 : 簡易風洞実験による布乾燥時間予測
- 会議報告 : IJCAI99
- 音声中の母音部と子音部の判別
- 音声中の母音部と子音部の特徴抽出
- EM法を用いた複数情報源からの概念獲得
- EM法を用いた複数情報源からの概念獲得
- ケプストラム処理による確率密度関数の分離
- オフィス移動ロボットJijo-2 の音声対話システム
- 事情通ロボットの音声対話インターフェース
- サンプル画像を用いた話者表情の生成とテレビ電話へのその応用
- 正弦波モデルの波形表現特性
- 正弦波モデルによる音声波形表現について
- 高い周波数分析精度の信号分析手法
- 短時間ケプストラム差分によるBlind Dereverberation
- 室内伝達関数留数モデルと零点分布
- 連続な位相特性の新しい計算手法
- 留数モデルによる室内伝達関数の位相特性解析
- 残響音場伝達特性の位相特性と零点分布
- 障害物による散乱音場の位相特性
- 残響音場伝達関数の位相特性
- 伝達関数のTruncationと零点分布
- RWC自律学習機能 : オフィスロボットJijo-2わ中心として
- ブラインド信号分離におけるPCAフィルタの効果
- サブスペース法と空間逆フィルタを用いた音源分離
- 一般調和解析を用いた音声帯域圧縮法
- R02-(6) クリーンエネルギーと住宅 : 燃料電池への期待と課題(ヒトと環境にやさしい技術 : その最新開発動向)(流体工学部門企画)
- ニューラルネットワークによる話者認識
- 4)ニューラルネットワークによる話者認識(視聴覚技術研究会)
- ニューラルネットワークによる話者認識
- マイクロホンアレイを用いた音声認識方向辞書の精度が認識率に及ぼす影響
- 周波数領域のInfomaxとサブスペース法を併用した音響信号のブラインド分離
- ベイジアンネットの学習の知能システムへの応用
- 統計的推論とAIの推論 (AIの手法と周辺の基礎理論)
- 多層パーセプトロンの学習における中間層に付加したノイズの影響とネットワークの構造化
- 独立なノイズの付加による多層パーセプトロンの構造化学習
- 2. 理論基盤の研究 ( リアルワールドコンピューティング研究計画)