部分空間法を用いた動的・静的特徴統合による話者照合
スポンサーリンク
概要
- 論文の詳細を見る
話者認識における問題点の一つとして, 発話内容や発声時期の違い等による音声の特徴変動が挙げられる.この音声の特徴変動に対して, 音声中に含まれている音韻性と話者性を分離し, 話者性のみを抽出することができれば, 頑健な話者認識が可能となると考えられる.そこで, 本研究では, 音声中に含まれている話者性のみを抽出する試みとして, 主成分分析に基づく部分空間法を用いた話者固有空間による話者照合法を提案する.また, 音声の特徴変動の正規化法として, 話者固有空間における話者の動的・静的特徴統合法を提案する.本手法の有効性を示すために, 話者照合における従来法であるGMMとの比較実験を行った結果, 提案手法はGMMと同等の照合精度が得られ, 話者照合において有効であることがわかった.
- 社団法人電子情報通信学会の論文
- 2000-01-21
著者
関連論文
- 日本手話の表現速度の違いによる手動作変化の分析(福祉と音声処理,一般)
- Webページ間の関係に着目した大規模サイトの構造化の調査 : 音声ブラウザ利用におけるアクセシビリティの検討
- 3DCGによる手話文アニメーション合成システムの構築と評価(福祉と知能・情動・認知障害,福祉と音声処理,一般)
- 非負値行列因子分解に基づく多人数会話における話者分類
- NMFに基づくクラスタリングを適用したAnchor Modelによる話者認識
- 異なる認識単位の認識器から得られた信頼度を素性に用いた音声認識
- 位置と動きに基づくマルチストリームHMMを用いた手話認識
- 手の位置と動きに着目したHMMによる手話単語の認識(一般,膨大なデータから学ぶもの)
- 手の位置と動きに着目したHMMによる手話単語の認識(一般,膨大なデータから学ぶもの)
- KL情報量によるAnchor modelの階層的クラスタリングに基づく話者認識
- 書き起こしへの付与を目指した音声とテキストを対象とした発話印象の分析
- 音声認識の信頼度に着目した文境界検出に関する検討(一般(ポスターセッション),第11回音声言語シンポジウム)
- 音声認識の信頼度に着目した文境界検出に関する検討
- 視覚障害者のための意味情報を用いた仮名漢字変換における説明語選択手法の検討(福祉と音声処理,一般)
- 曲中のブレスによる合図を利用した伴奏システム
- 日本手話対話の話者交替時の重複現象の分析
- 日本手話対話の話者交替時の重複現象の分析(一般セッション,コミュニケーション支援,共生コミュニケーション及び一般)
- 日本手話対話の話者交替時の重複現象の分析(一般セッション,コミュニケーション支援,共生コミュニケーション及び一般)
- 日本手話対話の話者交替時の重複現象の分析(一般セッション,コミュニケーション支援,共生コミュニケーション及び一般)
- ブレスによる合図を検出する伴奏システム
- 音声認識を用いたスポーツ実況中継におけるハイライトシーン検出
- GMMに基づく音声信号推定法を用いた雑音下音声認識
- GMMに基づく音声信号推定法を用いた雑音下音声認識
- 自動拡張辞書を用いたキーワードスポッティングによる音声対話型情報検索
- 基板検査用治具設計のための微細画像処理システムの開発
- ニュース映像における記事切り出しのカット点検出への依存性
- 音声認識と文字認識の統合に基づく商品紹介ビデオの区間分割と索引付け
- 音声認識の信頼度に着目した文境界検出に関する検討 (音声)
- 日本手話におけるうなずきと接続詞の分析(福祉と音声処理,一般)
- 日本手話におけるうなずきと接続詞の分析(福祉と音声処理,一般)
- 日本手話の表現速度の違いによる手動作変化の分析(福祉と音声処理,一般)
- 音声認識と話者認識を統合した話者の人名付与システム(音声言語情報処理とその応用)
- 単語・音素事後確率によるデコーディングに基づく音響モデルの教師なし適応化
- ユーザー発話のセグメンテーションと発話評価機能をもつ英語学習支援システム
- ユーザー発話のセグメンテーションと発話評価機能をもつ英語学習支援システム
- 音素事後確率に基づく信頼度を用いた音響モデルの教師なし適応化
- 雑音除去音声に対する特徴量抽出とMLLR適応の統合による雑音に頑健な音声認識
- 雑音除去音声に対する特徴量抽出とMLLR適応の統合による雑音に頑健な音声認識
- モデル適応と雑音除去の併用による非定常雑音下での音声認識
- 部分空間と混合分布モデルを用いた声質変換
- 非定常雑音下での連続音声認識を目的とした音声信号の時間推移の推定に基づく雑音除去法の検討
- 音声の時間変化モデルに基づく音声信号推定法を用いた非定常雑音下での音声認識
- 自動抽出されたアナウンサー発話に対するニュースディクテーションと記事分類
- 部分空間射影の類似度による顔領域の追跡
- 部分空間射影による顔領域の追跡と学習
- 文字らしさを表す複数の部分空間を用いた手書き文字の切り出しと認識
- 複数の部分空間による手書き文字の切り出しと認識
- 動画像におけるアフィン変換を用いたカメラワークの正規化
- 講義音声を対象としたトピックセグメンテーションの検討
- テロップ区間と音声ディクテーションから導かれる単語空間の学習方式の検討 : トピックセグメンテーションへの応用
- 音声ディクテーションの誤りを考慮した検索方式の検討
- ニュース音声に対する教師なしトピックセグメンテーションにおける単語重要度決定方法の比較
- D-14-8 ベイズリスク最小化音声認識に基づく大学情報検索システムの構築(D-14.音声,一般セッション)
- D-14-5 日本語母語話者を対象としたモデル選択と話者適応に基づく英語音声認識(D-14.音声,一般セッション)
- 音声入力型大学情報検索システムに対するベイズリスク最小化音声認識の適用
- 音声入力型大学情報検索システムに対するベイズリスク最小化音声認識の適用
- 顔認識における修正CLAFIC法の提案
- 修正CLAFIC法による顔認識と話者認識の統合
- 実環境下での話者認識におけるPMC法の効果について
- ガウス分布から導出される部分空間法による話者照合法の検討
- 音韻性を抑えた話者空間への射影による話者認識
- 音韻分散を考慮した空間変換による音声認識法の検討
- 部分空間分離に基づく音声認識法の検討
- 音韻空間への射影に基づく話者正規化
- 話者固有空間における動的・静的特徴統合による話者照合
- 音韻空間への射影に基づく話者正規化による音素認識
- 音韻空間への射影に基づく話者正規化による音素認識
- 音韻空間への射影に基づく話者正規化による音素認識
- 話者補空間における話者認識
- SP2000-12 話者補空間射影による話者認識
- 部分空間法を用いた話者照合における動的・静的特徴統合 -部分空間次元数の事前設定の検討-
- 部分空間法を用いた動的・静的特徴統合による話者照合
- アナウンサー発話の自動抽出とディクテーションによるニュース記事分類 (音声言語情報処理)
- ドラマにおける話者インデキシングの検討
- 部分空間法による話者照合
- 視覚障害者のための意味情報を用いた仮名漢字変換における説明語選択手法の検討(福祉と音声処理,一般)
- 自動学習による話者セグメンテーション
- ニュース音声中のアナウンサー発話区間の自動切り出し
- 座談会における話者区間の切り出し
- クラウド時代の新しい音声研究パラダイム
- 視覚障害支援のための意味情報に基づく仮名漢字変換(福祉工学)
- D-14-4 音声対話型CALLシステムの認識性能評価(D-14.音声,一般セッション)
- 発話内分散に基づき動的に生成された話者空間による話者クラスタリング(ポスターセッション,第13回音声言語シンポジウム)
- D-14-5 音声対話型CALLシステムでの信頼度評価の検討(D-14.音声,一般セッション)
- 発話内分散に基づき動的に生成された話者空間による話者クラスタリング(ポスターセッション,第13回音声言語シンポジウム)
- 発話内分散に基づき動的に生成された話者空間による話者クラスタリング
- 発話内分散に基づき動的に生成された話者空間による話者クラスタリング
- RE-001 GMMの分布選択に基づくアンカーモデルのクラスタリングによる話者認識(音声言語処理,E分野:自然言語・音声・音楽)
- 話者認識におけるロバストネス(話者認識に関する研究の動向)
- 音素決定木に基づく対話型CALLシステムに対する有効な音素セットの構築に関する検討
- 音声入力による音声ドキュメント検索における単語重要度を考慮したベイズリスク最小化音声認識
- RE-002 文単位で分割されたテキストで学習した言語モデルによる単語信頼度を用いた文境界検出(音声言語処理,E分野:自然言語・音声・音楽)
- オープンソース音声認識エンジンJuliusへのベイズリスク最小化機能の実装と評価(音声,聴覚,システム開発論文)
- 話者認識技術の現状と課題(オーガナイズドセッション(パネルディスカッション),音声アプリケーション,一般)
- 日本人学習者の中国語二声と三声の知覚トレーニングに関する研究(一般セッション,音声・言語・対話,一般)
- 音声の周期・非周期成分分解に基づく話者認識の検討(一般セッション,音声・言語・対話,一般)
- D-14-7 学習者コーパスを利用した音声対話型CALLシステムの開発(D-14.音声)
- 相互情報量を用いた辞書自動生成に基づく中国語ピンインから文字への変換の改善に関する検討(一般セッション,音声・言語・対話,一般)
- A-19-1 視覚障がい者のための重要文書抽出に基づくWeb検索支援(A-19.福祉情報工学)
- 学習者コーパスを利用した音声対話型CALLシステムにおける想定外発話検出手法(一般セッション,音声・言語・対話,一般)