Ergodic HMMを用いた未知・複数信号源クラスタリング問題の検討
スポンサーリンク
概要
- 論文の詳細を見る
入力された信号系列を複数個の信号源に分割し,信号源を推定する問題は,音声情報処理や言語処理などの極めて広い分野において存在する.本論文では,この問題を未知・複数信号源クラスタリング問題と名づけ, Ergodic HMMを用いた解決方法を提案する. Ergodic HMMにおいて,状態を信号源に,状態から出力されるシンボル系列を信号系列に対応させた場合,ビタビ復号法およびForward復号法によりセグメンテーション位置とカテゴリー識別を同時に推定することができる.次に,この問題の応用として複数話者発話の識別を調べた.この実験の結果, Ergodic HMMの初期パラメータの値が重要であること,および話者性を有する特徴ベクトルとして長時間窓幅のLPCケプストラムが有効であることが示された.
- 社団法人電子情報通信学会の論文
- 1995-02-25
著者
関連論文
- 話者認証を用いたX Window施錠システムxvlock : 開発とその評価
- 話者認証を用いたX Window 施錠システム xvlock 開発とその評価(バリアフリーインタフェース, および一般)
- Ergodic HMMを用いた未知・複数信号源クラスタリング問題の検討
- N信号源モデルに基づく音声の区分化識別問題 : 話者特徴の違いに基づく区分化音声の識別
- 自由発話音声における音響的な特徴の検討
- Spotterにおける認識アルゴリズムの検討
- 音声対話における言語現象 (<小特集>音声によるコンピュータとの対話を目指して)
- 単語のtrigramを利用した文音声認識と自由発話認識への拡張
- 隠れマルコフモデルによる言語モデル自動獲得の検討
- 音声研究の現状と課題
- 譜面情報による楽曲の特徴付けの検討
- 譜面情報による楽曲の特徴付けの検討
- 字幕表示システムVCML Playerの新機能について
- 音声と音楽のセグメンテーションの最適化
- SP2000-17 Cepstrum Fluxを用いた音声と音楽のセグメンテーション
- 1K-4 標本化周波数識別法の雑音下音声に対する評価
- 音声の標本化周波数の自動識別方法
- 時間拘束条件下でのモデルを用いた重畳音声分解法
- 時間拘束条件下でのモデルを用いた重畳音声分解法
- SP2000-16 楽曲の高速検索手法の検討
- 話者認識を用いたコンピュータセキュリティシステムの評価
- Video Caption Player 2.4 : 複数字幕同時表示機能の追加(ヒューマンコミュニケーショングループ(HCG)シンポジウム)
- 字幕表示用言語VCMLの設計とその表示システムの開発
- 字幕自動生成における字幕と音声の時間軸整合の検討
- 任意個数の時系列に含まれる類似部分探索法(システム,第9回音声言語シンポジウム)
- 任意個数の時系列に含まれる類似部分探索法(システム,第9回音声言語シンポジウム)
- 任意個数の時系列に含まれる類似部分探索法(システム,第9回音声言語シンポジウム)
- 音響情報の検索
- 5N-9 手話パターン間距離の導出
- 2T-2 インターネット対応音響効果支援ツールキットの開発
- セグメントの高速探索法
- ビデオデータにおける指定人物の検出と追跡 : 音声部分を用いた処理
- 音響シーンセグメントの接続の検討