Earth Mover's Distanceを用いた分散型話者認識(合成・生成,韻律,一般)
スポンサーリンク
概要
- 論文の詳細を見る
本稿では分散型話者認識において, GMMのような統計的モデルを仮定しないノンパラメトリックな話者認識手法を提案する.話者モデルと認識対象データはそれぞれ,話者登録用音声並びに認識対象音声から得られた特徴パラメータを量子化したデータの集合(ノンパラメトリックな分布)で構成される.話者認識時には,各特徴パラメータの集合間の距離を計算し,最も距離の小さい話者モデルを認識話者とする.話者認識時に必要となる距離尺度には,ある2つの分布間において,一方の分布を他方の分布に変換するための最小のコストにより距離を定義するEarth Mover's Distance を用いる.提案手法の有効性を検証するため,特徴パラメータ抽出にETSI標準DSRフロントエンドを用いて,男性話者21名によるテキスト独立型話者識別実験を行った.実験の結果. GMMを用いた話者識別に比べ識別誤り率を, 8kHzサンプリングにおいて67.7%, 16kHzサンプリングにおいて75.0%削減することができた.
- 社団法人電子情報通信学会の論文
- 2004-08-12
著者
-
任 福継
Tokushima Univ. Tokushima‐shi Jpn
-
黒岩 眞吾
徳島大学工学部
-
任 福継
徳島大学工学部
-
柘植 覚
徳島大学工学部
-
黒岩 眞吾
(株)ケイディディ研究所
-
柘植 覚
徳島大学大学院ソシオテクノサイエンス研究部情報ソリューション部門
-
Tsuge Satoru
Atr Interpreting Telecommunications Research Laboratories
-
梅田 良幸
徳島大・工
-
梅田 良幸
徳島大学工学部
-
福田 一平
徳島大学工学部
関連論文
- Fuzzy Cluster Analysis and its Evaluation Method(BIOMETRICS AND ITS APPLICATIONS)
- 実用会話システムにおける対話型案内コンテンツの構築
- 実用会話システムにおける対話型案内コンテンツの構築(対話)
- 雑音下音声認識評価ワーキンググループ活動報告 : 認識に影響する要因の個別評価環境(3)(SIG-SLP内組織の活動報告)
- 雑音下音声認識評価ワーキンググループ活動報告 : 認識に影響する要因の個別評価環境(2)(雑音・VAD,第9回音声言語シンポジウム)
- 雑音下音声認識評価ワーキンググループ活動報告 : 認識に影響する要因の個別評価環境 (2)(雑音・VAD,第9回音声言語シンポジウム)
- 雑音下音声認識評価ワーキンググループ活動報告 : 認識に影響する要因の個別評価環境(第8回音声言語シンポジウム)
- 雑音下音声認識評価ワーキンググループ活動報告 : 認識に影響する要因の個別評価環境(Session-1 検出,第8回音声言語シンポジウム)
- 大規模話者骨導音声データベースを用いたテキスト独立型話者照合実験(一般(ポスターセッション),第9回音声言語シンポジウム)
- CENSREC-1-C : 雑音下音声区間検出評価基盤の構築
- SLP雑音下音声認識評価WG活動報告 : 評価用データと評価手法について(Session-6 スペシャルセッション: 共通コーパスを利用した耐雑音技術評価, 第7回音声言語シンポジウム)
- 日英対訳感情表現コーパスに基づく感情表現抽出手法の提案(情報抽出・評判分析)
- 感情生起事象文型パターンに基づいた会話文からの感情推定手法
- 感情コーパス作成支援システムの開発(コーパス, 学習, 対話, 要約)
- 感情計測システムについて(福祉と言語処理, 一般)
- 感情計測システムについて(福祉と言語処理,一般)
- WWW画像検索システムを用いた関連語の自動収集手法(検索)
- 大規模話者骨導音声データベースを用いたテキスト独立型話者照合実験(一般(ポスターセッション),第9回音声言語シンポジウム)
- 大規模話者骨導音声データベースを用いたテキスト独立型話者照合実験(一般(ポスターセッション),第9回音声言語シンポジウム)
- A practical sightseeing question answering system based on integrated knowledge-base (特集 知識情報化社会を支えるシステム技術)
- 順位統計量を用いた話者照合のためのコホート話者選択方法
- 意味素に基づく隠喩の名詞句"AのB"の意味解析
- 意味素に基づく隠喩の名詞句"AのB"の意味解析
- 順位統計量を用いた話者照合のためのコホート話者選択方法
- Super-Function に基づく日英機械翻訳における日付・時間表現の抽出
- 符号化音声認識のための合成音声を用いた不特定話者音響モデルの適応法(音声,聴覚)
- Super-Functionを用いた日英機械翻訳における日付・時間表現の抽出
- N-gram出現頻度を用いた感情類似度計算
- 感情コーパス構築のための文中の語に基く感情分類手法
- N-gram出現頻度を用いた感情類似度計算(感情・評価)
- 感情コーパス構築のための文中の語に基く感情分類手法(感情・評価)
- 分散音声認識における実時間周波数特性正規化手法(音声言語)
- 順位統計量を用いた話者照合のためのコホート話者選択方法(一般(ポスターセッション),第11回音声言語シンポジウム)
- スペクトルの微細構造を考慮した風雑音除去手法(電気音響,音響一般)
- 適応エコーキャンセラにおけるステップゲイン制御法(信号処理,スペクトル拡散,及び一般)
- 適応エコーキャンセラにおけるステップゲイン制御法(信号処理,スペクトル拡散,及び一般)
- 新聞記事の意見抽出のための感情語辞書の有効性に関する考察(思考と知識検索・獲得,一般)
- 13-105 学生自主プロジェクト活動実態に関する考察((17)工学教育システムの個性化・活性化-II)
- Super-Functionによる機械翻訳エンジンのWeb実現について(機械翻訳)
- 語用情報を含む「論語」知識ベースの構築
- E-032 語用論に基づく 「論語」検索システムの構築(自然言語・音声・音楽,一般論文)
- VSMに基づくSVMと構文解析手法を用いた旅行案内システムの構築(ツール・システム)
- 単語表記と音声特徴を用いた聞き手の感情推定手法の提案
- 心的モデルを用いた会話エージェントの表情生成手法
- 明示的な関係にある語彙の抽出(思考と知識検索・獲得,一般)
- WWW画像検索システムにおける有害画像フィルタリング手法
- D-030 WWW画像検索システムを用いた有害サイトURLデータベースの構築手法(D.データベース)
- ベクトル空間モデルに基づく特定領域向け中国語質問応答システムの構築
- 感情計測システムについて(福祉と言語処理, 一般)
- 順位キューを用いた多次元データの高速近傍検索アルゴリズム
- 出現URLの類似性に着目したWWW空間からの関連語自動収集手法(抽出, 言い換え)
- 音声認識・音声合成を用いた音声途切れ補間手法
- スペクトルの微細構造を考慮した風雑音除去手法
- 長・短期間における音声の話者内変動に関する検討
- ベクトル量子化と Earth Mover's Distance を用いた分散型話者認識手法
- 統計的手法を用いた音声信号の復元手法の改良
- D-040 領域分割画像に基づく言語メタデータの自動生成手法(D.データベース)
- 機械翻訳における使役表現の翻訳規則について(機械翻訳)
- 対訳例文から中日数量表現の翻訳規則の獲得について(機械翻訳)
- 情報検索のために単一ドキュメントからキーワード抽出(抽出, 言い換え)
- 機械学習を用いた中国語意味的依存構造の推定(解析, 分析)
- 顔特徴を用いた表情の認識(福祉と言語処理, 一般)
- 顔特徴を用いた表情の認識(福祉と言語処理,一般)
- コーパスごとの類似度を考慮した用例に基づく感情推定手法の改善
- 自然言語処理技術を用いた中学理科教授学習システム(福祉と言語処理, 一般)
- 自然言語処理技術を用いた中学理科教授学習システム(福祉と言語処理,一般)
- 自然言語処理技術を用いた中学理科教授学習システム(福祉と言語処理, 一般)
- Search computing based on Google API for QA system (自然言語処理)
- Search computing based on Google API for QA system (言語理解とコミュニケーション)
- Create Special Domain News Collections through Summarization and Classification
- 周波数特性の変動に頑健な実時間分散音声認識手法(第5回音声言語シンポジウム : 耐雑音)
- 周波数特性の変動に頑健な実時間分散音声認識手法(第5回音声言語シンポジウム : 耐雑音)
- 日本語音声コーパスを用いた ETSI STQ DSR Advanced Front-End の評価
- Nonparametric Speaker Recognition Method Using Earth Mover's Distance(Speaker Recognition, Statistical Modeling for Speech Processing)
- Speaker Recognition using a Non-parametric Speaker Model Representation and Earth Mover's Distance
- Speaker Recognition using a Non-parametric Speaker Model Representation and Earth Mover's Distance
- Speaker Recognition using a Non-parametric Speaker Model Representation and Earth Mover's Distance
- An Interactive E-learning System for Practicing Team Care by Interdisciplinary Collaboration
- 音声認識・音声合成を用いた音声途切れ補間手法
- 複数雑音モデルを用いた風雑音除去手法(合成・生成,韻律,一般)
- サポートベクターマシンによる適合性フィードバックを用いた情報検索(情報検索)
- サポートベクターマシンによる適合性フィードバックを用いた情報検索
- 画像知識データベースを用いたWWW画像検索システムの開発(画像検索・映像データベース)
- Non-negative Matrix Factorizationを用いた情報検索モデルの次元圧縮および検索質問拡張
- A Model of Mental State Transition Network
- A New Question Answering System for Chinese Restricted Domain(Language,Human Communication II)
- Effects of Phoneme Type and Frequency on Distributed Speaker Identification and Verification(Speech and Hearing)
- Earth Mover's Distanceを用いた分散型話者認識(合成・生成,韻律,一般)
- 大規模顔画像データベースに対する印象語による類似顔画像検索技術に関する研究
- 周波数特性の変動に頑健な分散音声認識手法
- ETSI標準分散音声認識フロントエンドを用いた音声認識実験
- PD-2-3 電話サービスのための音声認証技術
- 音素依存線形判別分析の検討
- Simple PCAを用いたベクトル空間情報検索モデルの次元削減
- Non-negative Matrix Factorizationを用いた情報検索
- 顔特徴を用いた表情の認識(福祉と言語処理, 一般)
- 人間の感情を測定する
- E-037 シナリオ対話感情コーパスの構築と分析(対話・コミュニケーション,E分野:自然言語・音声・音楽)
- E-012 日中機械翻訳のためのスーパー関数抽出における対訳辞書自動構築(言語資源,E分野:自然言語・音声・音楽)
- E-032 用例間の類似度に基づく若者言葉の感情推定手法(感情・評判,E分野:自然言語・音声・音楽)