Effects of Phoneme Type and Frequency on Distributed Speaker Identification and Verification(Speech and Hearing)
- 論文の詳細を見る
In the European Telecommunication Standards Institute (ETSI), Distributed Speech Recognition (DSR) front-end, the distortion added due to feature compression on the front end side increases the variance flooring effect, which in turn increases the identification error rate. The penalty incurred in reducing the bit rate is the degradation in speaker recognition performance. In this paper, we present a nontraditional solution for the previously mentioned problem. To reduce the bit rate, a speech signal is segmented at the client, and the most effective phonemes (determined according to their type and frequency) for speaker recognition are selected and sent to the server. Speaker recognition occurs at the server. Applying this approach to YOHO corpus, we achieved an identification error rate (ER) of 0.05% using an average segment of 20.4% for a testing utterance in a speaker identification task. We also achieved an equal error rate (EER) of 0.42% using an average segment of 15.1% for a testing utterance in a speaker verification task.
- 社団法人電子情報通信学会の論文
- 2006-05-01
任 福継
Tokushima Univ. Tokushima‐shi Jpn
Kuroiwa Shingo
University Of Tokushima
FATTAH Mohamed
University of Tokushima
REN Fuji
University of Tokushima
Kuroiwa S
University of Tokushima
Fattah MA
University of Tokushima
Ren F
University of Tokushima
- Fuzzy Cluster Analysis and its Evaluation Method(BIOMETRICS AND ITS APPLICATIONS)
- 実用会話システムにおける対話型案内コンテンツの構築
- 実用会話システムにおける対話型案内コンテンツの構築(対話)
- 大規模話者骨導音声データベースを用いたテキスト独立型話者照合実験(一般(ポスターセッション),第9回音声言語シンポジウム)
- 日英対訳感情表現コーパスに基づく感情表現抽出手法の提案(情報抽出・評判分析)
- 感情生起事象文型パターンに基づいた会話文からの感情推定手法
- 感情コーパス作成支援システムの開発(コーパス, 学習, 対話, 要約)
- 感情計測システムについて(福祉と言語処理, 一般)
- 感情計測システムについて(福祉と言語処理,一般)
- 大規模話者骨導音声データベースを用いたテキスト独立型話者照合実験(一般(ポスターセッション),第9回音声言語シンポジウム)
- 大規模話者骨導音声データベースを用いたテキスト独立型話者照合実験(一般(ポスターセッション),第9回音声言語シンポジウム)
- A practical sightseeing question answering system based on integrated knowledge-base (特集 知識情報化社会を支えるシステム技術)
- 意味素に基づく隠喩の名詞句"AのB"の意味解析
- 意味素に基づく隠喩の名詞句"AのB"の意味解析
- Super-Function に基づく日英機械翻訳における日付・時間表現の抽出
- 符号化音声認識のための合成音声を用いた不特定話者音響モデルの適応法(音声,聴覚)
- Super-Functionを用いた日英機械翻訳における日付・時間表現の抽出
- N-gram出現頻度を用いた感情類似度計算
- 感情コーパス構築のための文中の語に基く感情分類手法
- N-gram出現頻度を用いた感情類似度計算(感情・評価)
- 感情コーパス構築のための文中の語に基く感情分類手法(感情・評価)
- 分散音声認識における実時間周波数特性正規化手法(音声言語)
- スペクトルの微細構造を考慮した風雑音除去手法(電気音響,音響一般)
- 新聞記事の意見抽出のための感情語辞書の有効性に関する考察(思考と知識検索・獲得,一般)
- Super-Functionによる機械翻訳エンジンのWeb実現について(機械翻訳)
- 語用情報を含む「論語」知識ベースの構築
- E-032 語用論に基づく 「論語」検索システムの構築(自然言語・音声・音楽,一般論文)
- VSMに基づくSVMと構文解析手法を用いた旅行案内システムの構築(ツール・システム)
- 単語表記と音声特徴を用いた聞き手の感情推定手法の提案
- 心的モデルを用いた会話エージェントの表情生成手法
- 明示的な関係にある語彙の抽出(思考と知識検索・獲得,一般)
- ベクトル空間モデルに基づく特定領域向け中国語質問応答システムの構築
- 音声認識・音声合成を用いた音声途切れ補間手法
- スペクトルの微細構造を考慮した風雑音除去手法
- 長・短期間における音声の話者内変動に関する検討
- ベクトル量子化と Earth Mover's Distance を用いた分散型話者認識手法
- 統計的手法を用いた音声信号の復元手法の改良
- 機械翻訳における使役表現の翻訳規則について(機械翻訳)
- 対訳例文から中日数量表現の翻訳規則の獲得について(機械翻訳)
- 情報検索のために単一ドキュメントからキーワード抽出(抽出, 言い換え)
- 機械学習を用いた中国語意味的依存構造の推定(解析, 分析)
- AURORA-2J: An Evaluation Framework for Japanese Noisy Speech Recognition(Speech Corpora and Related Topics, Corpus-Based Speech Technologies)
- Missing Feature Theory Applied to Robust Speech Recognition over IP Network(Speech Dynamics by Ear, Eye, Mouth and Machine)
- 顔特徴を用いた表情の認識(福祉と言語処理, 一般)
- 顔特徴を用いた表情の認識(福祉と言語処理,一般)
- コーパスごとの類似度を考慮した用例に基づく感情推定手法の改善
- 自然言語処理技術を用いた中学理科教授学習システム(福祉と言語処理, 一般)
- 自然言語処理技術を用いた中学理科教授学習システム(福祉と言語処理,一般)
- Search computing based on Google API for QA system (自然言語処理)
- Search computing based on Google API for QA system (言語理解とコミュニケーション)
- Create Special Domain News Collections through Summarization and Classification
- Nonparametric Speaker Recognition Method Using Earth Mover's Distance(Speaker Recognition, Statistical Modeling for Speech Processing)
- Speaker Recognition using a Non-parametric Speaker Model Representation and Earth Mover's Distance
- Speaker Recognition using a Non-parametric Speaker Model Representation and Earth Mover's Distance
- Speaker Recognition using a Non-parametric Speaker Model Representation and Earth Mover's Distance
- An Interactive E-learning System for Practicing Team Care by Interdisciplinary Collaboration
- 複数雑音モデルを用いた風雑音除去手法(合成・生成,韻律,一般)
- A Model of Mental State Transition Network
- A New Question Answering System for Chinese Restricted Domain(Language,Human Communication II)
- Effects of Phoneme Type and Frequency on Distributed Speaker Identification and Verification(Speech and Hearing)
- Earth Mover's Distanceを用いた分散型話者認識(合成・生成,韻律,一般)
- 人間の感情を測定する
- E-037 シナリオ対話感情コーパスの構築と分析(対話・コミュニケーション,E分野:自然言語・音声・音楽)
- E-012 日中機械翻訳のためのスーパー関数抽出における対訳辞書自動構築(言語資源,E分野:自然言語・音声・音楽)
- E-032 用例間の類似度に基づく若者言葉の感情推定手法(感情・評判,E分野:自然言語・音声・音楽)