クラスタリングに基づくGMM学習法による話者モデルの構築(話者認識・照合,認識,理解,対話,一般)
スポンサーリンク
概要
- 論文の詳細を見る
話者識別において話者モデルとしてガウス混合分布(GMM)が広く用いられている.これはGMMが複雑な話者の特徴を確率分布として表現でき,EMアルゴリズムでモデルのパラメータを推定できるからである.しかし,モデルを推定するための訓練データが少ない場合や,訓練データに対して混合数が多い場合は過学習を起こすという問題がある.また,話者モデルとしてGMMを用いる場合,各ガウス分布が音響特徴が類似した音声の一部とそれぞれ対応することが望ましい.しかし,最尤推定でパラメータを推定した場合は,必ずしも対応関係があるとはいえない.そこでクラスタリングに基づいたGMM学習法を提案する.これはクラスタリングを使用することで,ある一部の音声と各ガウス分布との対応関係を明確にし,それぞれの分布に属する特微量を調整することで過学習を防ぐ.本論文では,この提案方法によりパラメータを推定したGMMと,最尤推定でパラメータを推定したGMMの話者識別率を比較した.その結果,提案方法で推定したGMMは最尤推定でパラメータを推定したGMMに比べて最大11.6%精度の改善が得られた.
- 2011-07-14
著者
-
鈴木 基之
徳島大学大学院ソシオテクノサイエンス研究部
-
任 福継
徳島大学大学院
-
任 福継
徳島大学大学院ソシオテクノサイエンス研究部
-
北 研二
徳島大学高度情報化基盤センター
-
北 研二
徳島大
-
北 研二
徳島大学
-
北 研二
徳島大学大学院工学研究科知能情報工専攻
-
御船 正樹
徳島大学先端技術科学教育部
-
北 研二
徳島大学大学院ソシオテクノサイエンス研究部
-
鈴木 基之
徳島大学工学部
-
鈴木 基之
徳島大学大学院
関連論文
- 時間冗長性圧縮によるボコーダ型音声符号化の低ビットレート化(音声,聴覚)
- 徳島大学キャンパスネットワークシステムの更新について
- 距離索引VP-treeにおける解絞込みの一改良手法(マルチメディアデータベース,データ工学論文)
- 実用会話システムにおける対話型案内コンテンツの構築
- 実用会話システムにおける対話型案内コンテンツの構築(対話)
- 知能エージェント及び工学部ナビゲーションシステムの開発
- 時間冗長性圧縮によるボコーダ型音声符号化の低ビット化(言語獲得・学習,合成,生成,韻律,一般)
- 大規模話者骨導音声データベースを用いたテキスト独立型話者照合実験(一般(ポスターセッション),第9回音声言語シンポジウム)
- 類似画像検索技術を用いた商品推薦システム--『SUDACHI』の開発とその応用
- 質問応答データベースの自動作成に基づく音声対話システムの評価(ポスターセッション,第10回音声言語シンポジウム)
- 生成したテキストのNgramを用いた英語学習者による文法誤りを含んだ発話の音声認識の高精度化(一般(ポスターセッション),第9回音声言語シンポジウム)
- 時間冗長性圧縮によるボコーダ型音声符号化の低ビットレート化
- 感情認識及び感情創生に基づく知的学内案内ロボットの構築
- 言語・表情など外観情報と心的状態遷移に基づく人間感情の認知について(特別セッション)
- 日英対訳感情表現コーパスに基づく感情表現抽出手法の提案(情報抽出・評判分析)
- 感情生起事象文型パターンに基づいた会話文からの感情推定手法
- 感情コーパス作成支援システムの開発(コーパス, 学習, 対話, 要約)
- WWW画像検索システムを用いた関連語の自動収集手法(検索)
- 講義映像配信システムにおける講義映像と資料の対応
- 大規模話者骨導音声データベースを用いたテキスト独立型話者照合実験(一般(ポスターセッション),第9回音声言語シンポジウム)
- 大規模話者骨導音声データベースを用いたテキスト独立型話者照合実験(一般(ポスターセッション),第9回音声言語シンポジウム)
- フィルタバンク特徴量とEarth Mover's Distanceを用いた音楽検索
- 質問応答データベースの自動作成に基づく音声対話システムの評価(ポスターセッション,第10回音声言語シンポジウム)
- 音程に注目した歌唱音声中の音符区間推定
- 意味素に基づく隠喩の名詞句"AのB"の意味解析
- 意味素に基づく隠喩の名詞句"AのB"の意味解析
- Aspectモデルを用いた話者と環境適応音声認識システムの検討(一般(ポスターセッション),第9回音声言語シンポジウム)
- Aspectモデルを用いた話者と環境適応音声認識システムの検討(一般(ポスターセッション),第9回音声言語シンポジウム)
- Earth Mover's Distanceを用いたハミングによる類似音楽検索手法(音楽情報検索,便利で身近な音楽情報処理)
- Super-Function に基づく日英機械翻訳における日付・時間表現の抽出
- 符号化音声認識のための合成音声を用いた不特定話者音響モデルの適応法(音声,聴覚)
- Super-Functionを用いた日英機械翻訳における日付・時間表現の抽出
- N-gram出現頻度を用いた感情類似度計算
- 感情コーパス構築のための文中の語に基く感情分類手法
- N-gram出現頻度を用いた感情類似度計算(感情・評価)
- 感情コーパス構築のための文中の語に基く感情分類手法(感情・評価)
- 分散音声認識における実時間周波数特性正規化手法(音声言語)
- ハミングによる検索機能を備えた音楽配信システムの開発
- サフィックス・アレイに基づく言語モデルを用いた音声認識に関する研究
- 検索質問と字幕の文字画像特徴量間の距離に基づく字幕検索手法
- スペクトルの微細構造を考慮した風雑音除去手法(電気音響,音響一般)
- 豊心工学(自然言語の論理と感情)
- 豊心工学(招待講演,自然言語の論理と感情)
- 意味素に基づく隠喩の名詞句'AのB"の意味解析
- 意味素に基づく隠喩の名詞句'AのB"の意味解析
- 4W-9 名詞にかかる形容詞を対象としたSuper-Functionの拡張(機械翻訳,学生セッション,人工知能と認知科学,情報処理学会創立50周年記念)
- 4W-3 英語科学技術論文執筆支援のための日英対訳例文データベース自動構築手法(機械翻訳,学生セッション,人工知能と認知科学,情報処理学会創立50周年記念)
- G-003 距離尺度にEarth Mover's Distanceを用いたハミングによる類似音楽検索手法(G分野:音声・音楽)
- 新聞記事の意見抽出のための感情語辞書の有効性に関する考察(思考と知識検索・獲得,一般)
- Super-Functionによる機械翻訳エンジンのWeb実現について(機械翻訳)
- 語用情報を含む「論語」知識ベースの構築
- E-032 語用論に基づく 「論語」検索システムの構築(自然言語・音声・音楽,一般論文)
- VSMに基づくSVMと構文解析手法を用いた旅行案内システムの構築(ツール・システム)
- 明示的な関係にある語彙の抽出(思考と知識検索・獲得,一般)
- 質問応答データベースの自動作成に基づく音声対話システムの評価(ポスターセッション,第10回音声言語シンポジウム)
- "えもにゅ"における短文の感情推定について
- "えもにゅ"における短文の感情推定について
- 6X-5 オントロジーに基づく多様な発話に対応した対話システムの構築(対話,学生セッション,人工知能と認知科学,情報処理学会創立50周年記念)
- 1U-1 LSP係数の性質を考慮した音声符号化の改善(音声分析・強調,学生セッション,人工知能と認知科学,情報処理学会創立50周年記念)
- 5T-2 音程変化に基づく歌唱音声の音符区間検出(音楽信号処理,学生セッション,人工知能と認知科学,情報処理学会創立50周年記念)
- 1N-4 感情の表出ができる学内案内ロボットの構築について(システム評価,学生セッション,ソフトウェア科学・工学,情報処理学会創立50周年記念)
- WWW画像検索システムにおける有害画像フィルタリング手法
- D-030 WWW画像検索システムを用いた有害サイトURLデータベースの構築手法(D.データベース)
- 距離索引VP-treeにおける解絞り込みの一改良法(基盤・要素技術)(セマンティックウェブと自然言語処理その他一般)
- 距離索引VP-treeにおける解絞り込みの一改良法
- 合成音声と評価スコア統合に基づく英語のイントネーション評価(認識,理解,対話,一般)
- 音声対話システムにおけるタスク外発話処理の高度化に関する研究(システム,第9回音声言語シンポジウム)
- パス数削減や平滑化法を用いたSSS-freeによる音素認識の高精度化(一般(ポスターセッション),第9回音声言語シンポジウム)
- 決定木を用いた単語クラスタリングによる英語韻律自動評価の高精度化(教育システムにおけるプラットホームとコンテンツ開発論文)
- I-021 動き情報を用いたビットストリームパターン推定によるFlash VideoのMultiple Description符号化(グラフィクス・画像,一般論文)
- 3Y-3 Multiple Description符号化を用いたFlash Videoストリーミングのパケットロス補償に関する検討(画像符号化とその応用システム,学生セッション,ネットワーク)
- 小型ロボットによる音声認識のための内部雑音抑圧法
- 複数の音程特徴量によるハミング入力楽曲検索システムの高精度化(スペシャルセッション・歌情報処理1)
- 複数の音程特徴量によるハミング入力楽曲検索システムの高精度化(スペシャルセッション・歌情報処理1)
- 音声対話システムにおけるタスク外発話処理の高度化に関する研究(システム,第9回音声言語シンポジウム)
- パス数削減や平滑化法を用いたSSS-freeによる音素認識の高精度化(一般(ポスターセッション),第9回音声言語シンポジウム)
- 生成したテキストのNgramを用いた英語学習者による文法誤りを含んだ発話の音声認識の高精度化(一般(ポスターセッション),第9回音声言語シンポジウム)
- 3V-10 単語1-gramを用いた短文からの感情推定(文章・感情,学生セッション,人工知能と認知科学,情報処理学会創立50周年記念)
- "えもにゅ"における短文の感情推定について
- "えもにゅ"における短文の感情推定について
- 質問応答システムにおける質問文内の漢字文字列に対する用語特定手法(「ユニバーサルコミュニケーションを実現するための言語処理技術」シンポジウム)
- URLの類似性を考慮したWWW空間からの関連語収集手法(「ユニバーサルコミュニケーションを実現するための言語処理技術」シンポジウム)
- 質問応答システムにおける質問文内の用語特定(思考と知識検索・獲得,一般)
- Earth Mover's Distance の高速検索ライブラリ fastEMD の開発
- 字幕付き映像データからの字幕領域の検出手法
- WWW検索エンジンを用いた質問文内の用語特定手法
- WWW検索エンジンを用いた質問文内の用語特定手法(QA・Web検索)
- 順位キューを用いた多次元データの高速近傍検索アルゴリズム
- 出現URLの類似性に着目したWWW空間からの関連語自動収集手法(抽出, 言い換え)
- D-019 WWW画像検索システムにおける検索質問拡張に基づくフィードバック検索(D分野:データベース)
- コーパスごとの類似度を考慮した用例に基づく感情推定手法の改善
- 中国語インターネット用語コーパスの構築及び分析について
- クラスタリングに基づくGMM学習法による話者モデルの構築 (音声)
- 工学部案内の国際化対応プロジェクト
- 3D-7 「豊心工学」学問体系の確立(1) : ブログ情報に基づく感情状態解析(自然言語処理(1),一般セッション,人工知能と認知科学,情報処理学会創立50周年記念)
- クラスタリングに基づくGMM学習法による話者モデルの構築(話者認識・照合,認識,理解,対話,一般)
- クラスタリングに基づくGMM学習法による話者モデルの構築
- E-012 日中機械翻訳のためのスーパー関数抽出における対訳辞書自動構築(言語資源,E分野:自然言語・音声・音楽)
- E-032 用例間の類似度に基づく若者言葉の感情推定手法(感情・評判,E分野:自然言語・音声・音楽)
- モーラ系列と音象徴ベクトルによるオノマトペの印象推定法