N信号源モデルに基づく音声の区分化識別問題 : 話者特徴の違いに基づく区分化音声の識別
スポンサーリンク
概要
- 論文の詳細を見る
異なる特性をもつ複数個の信号源から信号が次々と重なりなく生成されるとき,逆にその信号系列から各々の信号源の生成した部分区間に区分化・識別する問題を本論文では検討する.部分区間への区分化・識別問題更にその部分問題である区分化部分区間の識別問題は音声情報処理のみならず応用範囲が極めて広い.本論文では,まずこの区分化・識別問題の定式化を述べる.次に部分区間の識別問題に限定して解法およびその応用例について述べる.解法として,Universal VQ符号の出力確率に基づく出力確率クラスタリング法を提案する.信号源とその遷移を全状態結合型隠れマルコフモデル(ergodic HMM)で表現し区分化と識別とを同時推定する方法もあるが,本論文では割愛する.本部分問題の一つの応用例として,話者特徴の違いに基づく音声識別問題を検討する.複数話者が重なりなく次々と音声を発話するものとし,各々の話者を本問題における信号源と考えることにより,音声区間の識別問題が定式化される.実験により提案した解法の有効性を示す.
- 社団法人電子情報通信学会の論文
- 1993-12-25
著者
関連論文
- 話者認証を用いたX Window施錠システムxvlock : 開発とその評価
- 話者認証を用いたX Window 施錠システム xvlock 開発とその評価(バリアフリーインタフェース, および一般)
- Ergodic HMMを用いた未知・複数信号源クラスタリング問題の検討
- N信号源モデルに基づく音声の区分化識別問題 : 話者特徴の違いに基づく区分化音声の識別
- 自由発話音声における音響的な特徴の検討
- Spotterにおける認識アルゴリズムの検討
- 音声対話における言語現象 (<小特集>音声によるコンピュータとの対話を目指して)
- 単語のtrigramを利用した文音声認識と自由発話認識への拡張
- 隠れマルコフモデルによる言語モデル自動獲得の検討
- 音声研究の現状と課題
- 譜面情報による楽曲の特徴付けの検討
- 譜面情報による楽曲の特徴付けの検討
- 字幕表示システムVCML Playerの新機能について
- 音声と音楽のセグメンテーションの最適化
- SP2000-17 Cepstrum Fluxを用いた音声と音楽のセグメンテーション
- 1K-4 標本化周波数識別法の雑音下音声に対する評価
- 音声の標本化周波数の自動識別方法
- 時間拘束条件下でのモデルを用いた重畳音声分解法
- 時間拘束条件下でのモデルを用いた重畳音声分解法
- SP2000-16 楽曲の高速検索手法の検討
- 話者認識を用いたコンピュータセキュリティシステムの評価
- Video Caption Player 2.4 : 複数字幕同時表示機能の追加(ヒューマンコミュニケーショングループ(HCG)シンポジウム)
- 字幕表示用言語VCMLの設計とその表示システムの開発
- 字幕自動生成における字幕と音声の時間軸整合の検討
- 任意個数の時系列に含まれる類似部分探索法(システム,第9回音声言語シンポジウム)
- 任意個数の時系列に含まれる類似部分探索法(システム,第9回音声言語シンポジウム)
- 任意個数の時系列に含まれる類似部分探索法(システム,第9回音声言語シンポジウム)
- 音響情報の検索
- 5N-9 手話パターン間距離の導出
- 2T-2 インターネット対応音響効果支援ツールキットの開発
- セグメントの高速探索法
- ビデオデータにおける指定人物の検出と追跡 : 音声部分を用いた処理
- 音響シーンセグメントの接続の検討