Speaker Recognition using a Non-parametric Speaker Model Representation and Earth Mover's Distance
スポンサーリンク
概要
- 論文の詳細を見る
In this paper, we propose a distributed speaker recognition method using a non-parametric speaker model and Earth Mover's Distance (EMD). In distributed speaker recognition, the quantized feature vectors are sent to a server. The Gaussian mixture model (GMM), the traditional method used for speaker recognition, is trained using the maximum likelihood approach. However, it is difficult to fit continuous density functions to quantized data. To overcome this problem, the proposed method represents each speaker model with a speaker-dependent VQ code histogram designed by registered feature vectors and directly calculates the distance between the histograms of speaker models and testing quantized feature vectors. To measure the distance between each speaker model and testing data, we use EMD which can calculate the distance between histograms with different bins. We conducted text-independent speaker identification experiments using the proposed method. Compared to results using the traditional GMM, the proposed method yielded relative error reductions of 32% for quantized data.
- 社団法人電子情報通信学会の論文
- 2004-12-13
著者
-
Tsuge Satoru
Institute of Technology and Science, The University of Tokushima
-
任 福継
Tokushima Univ. Tokushima‐shi Jpn
-
Ren Fuji
Faculty Of Engineering The University Of Tokushima
-
Tsuge Satoru
Institute Of Technology And Science The University Of Tokushima
-
Tsuge Satoru
The University Of Tokushima
-
Kuroiwa S
Chiba University And National Institute Of Information And Communications Technology
-
Kuroiwa Shingo
Graduate School Of Advanced Integration Science Chiba University
-
Kuroiwa Shingo
Faculty Of Engineering The University Of Tokushima
-
Shikano Kiyohiro
Chiba University And National Institute Of Information And Communications Technology
-
Ueda Yoshiyuki
The Faculty Of Engineering The University Of Tokushima
-
TSUGE Satoru
Faculty of Engineering, Tokushima University
-
UMEDA Yoshiyuki
Faculty of Engineering, Tokushima University
-
Tamura Satoshi
Gifu Univ.
関連論文
- Fuzzy Cluster Analysis and its Evaluation Method(BIOMETRICS AND ITS APPLICATIONS)
- 実用会話システムにおける対話型案内コンテンツの構築
- 実用会話システムにおける対話型案内コンテンツの構築(対話)
- 大規模話者骨導音声データベースを用いたテキスト独立型話者照合実験(一般(ポスターセッション),第9回音声言語シンポジウム)
- 日英対訳感情表現コーパスに基づく感情表現抽出手法の提案(情報抽出・評判分析)
- 感情生起事象文型パターンに基づいた会話文からの感情推定手法
- 感情コーパス作成支援システムの開発(コーパス, 学習, 対話, 要約)
- 感情計測システムについて(福祉と言語処理, 一般)
- 感情計測システムについて(福祉と言語処理,一般)
- 大規模話者骨導音声データベースを用いたテキスト独立型話者照合実験(一般(ポスターセッション),第9回音声言語シンポジウム)
- 大規模話者骨導音声データベースを用いたテキスト独立型話者照合実験(一般(ポスターセッション),第9回音声言語シンポジウム)
- A practical sightseeing question answering system based on integrated knowledge-base (特集 知識情報化社会を支えるシステム技術)
- 意味素に基づく隠喩の名詞句"AのB"の意味解析
- 意味素に基づく隠喩の名詞句"AのB"の意味解析
- Super-Function に基づく日英機械翻訳における日付・時間表現の抽出
- 符号化音声認識のための合成音声を用いた不特定話者音響モデルの適応法(音声,聴覚)
- Super-Functionを用いた日英機械翻訳における日付・時間表現の抽出
- N-gram出現頻度を用いた感情類似度計算
- 感情コーパス構築のための文中の語に基く感情分類手法
- N-gram出現頻度を用いた感情類似度計算(感情・評価)
- 感情コーパス構築のための文中の語に基く感情分類手法(感情・評価)
- 分散音声認識における実時間周波数特性正規化手法(音声言語)
- スペクトルの微細構造を考慮した風雑音除去手法(電気音響,音響一般)
- 新聞記事の意見抽出のための感情語辞書の有効性に関する考察(思考と知識検索・獲得,一般)
- Super-Functionによる機械翻訳エンジンのWeb実現について(機械翻訳)
- CENSREC-1-C : An evaluation framework for voice activity detection under noisy environments
- 語用情報を含む「論語」知識ベースの構築
- E-032 語用論に基づく 「論語」検索システムの構築(自然言語・音声・音楽,一般論文)
- VSMに基づくSVMと構文解析手法を用いた旅行案内システムの構築(ツール・システム)
- 単語表記と音声特徴を用いた聞き手の感情推定手法の提案
- 心的モデルを用いた会話エージェントの表情生成手法
- 明示的な関係にある語彙の抽出(思考と知識検索・獲得,一般)
- ベクトル空間モデルに基づく特定領域向け中国語質問応答システムの構築
- Function Labeling for Unparsed Chinese Text
- 音声認識・音声合成を用いた音声途切れ補間手法
- スペクトルの微細構造を考慮した風雑音除去手法
- 長・短期間における音声の話者内変動に関する検討
- ベクトル量子化と Earth Mover's Distance を用いた分散型話者認識手法
- 統計的手法を用いた音声信号の復元手法の改良
- 機械翻訳における使役表現の翻訳規則について(機械翻訳)
- 対訳例文から中日数量表現の翻訳規則の獲得について(機械翻訳)
- 情報検索のために単一ドキュメントからキーワード抽出(抽出, 言い換え)
- 機械学習を用いた中国語意味的依存構造の推定(解析, 分析)
- AURORA-2J: An Evaluation Framework for Japanese Noisy Speech Recognition(Speech Corpora and Related Topics, Corpus-Based Speech Technologies)
- Missing Feature Theory Applied to Robust Speech Recognition over IP Network(Speech Dynamics by Ear, Eye, Mouth and Machine)
- 顔特徴を用いた表情の認識(福祉と言語処理, 一般)
- 顔特徴を用いた表情の認識(福祉と言語処理,一般)
- コーパスごとの類似度を考慮した用例に基づく感情推定手法の改善
- 自然言語処理技術を用いた中学理科教授学習システム(福祉と言語処理, 一般)
- 自然言語処理技術を用いた中学理科教授学習システム(福祉と言語処理,一般)
- A design of adaptive beamformer based on average speech spectrum for noisy speech recognition
- A Microphone Array-Based 3-D N-Best Search Method for Recognizing Multiple Sound Sources
- Search computing based on Google API for QA system (自然言語処理)
- Search computing based on Google API for QA system (言語理解とコミュニケーション)
- Create Special Domain News Collections through Summarization and Classification
- Multi-Lingual Multi-Function Multi-Media Intelligent System
- Question Classification for Chinese Cuisine Question Answering System
- Nonparametric Speaker Recognition Method Using Earth Mover's Distance(Speaker Recognition, Statistical Modeling for Speech Processing)
- Speaker Recognition using a Non-parametric Speaker Model Representation and Earth Mover's Distance
- Speaker Recognition using a Non-parametric Speaker Model Representation and Earth Mover's Distance
- Speaker Recognition using a Non-parametric Speaker Model Representation and Earth Mover's Distance
- An Interactive E-learning System for Practicing Team Care by Interdisciplinary Collaboration
- 複数雑音モデルを用いた風雑音除去手法(合成・生成,韻律,一般)
- Translation of Japanese Noun Compounds at Super-Function Based MT System
- GAM : A General Auto-Associative Memory Model
- Recognition of Word Emotion State in Sentences
- A Model of Mental State Transition Network
- A New Question Answering System for Chinese Restricted Domain(Language,Human Communication II)
- Effects of Phoneme Type and Frequency on Distributed Speaker Identification and Verification(Speech and Hearing)
- Earth Mover's Distanceを用いた分散型話者認識(合成・生成,韻律,一般)
- Learning Relation Instances for Chinese Domain Ontology from the Web
- Improving Parsing of 'BA' Sentences for Machine Translation
- 人間の感情を測定する
- CENSREC-4: An evaluation framework for distant-talking speech recognition in reverberant environments
- E-037 シナリオ対話感情コーパスの構築と分析(対話・コミュニケーション,E分野:自然言語・音声・音楽)
- E-012 日中機械翻訳のためのスーパー関数抽出における対訳辞書自動構築(言語資源,E分野:自然言語・音声・音楽)
- E-032 用例間の類似度に基づく若者言葉の感情推定手法(感情・評判,E分野:自然言語・音声・音楽)