音素決定木に基づくGMMを用いた話者認識
スポンサーリンク
概要
- 論文の詳細を見る
個人情報流出や不正アクセスが相次ぎ、情報保護への関心が高まっている。その中で、利用者に低負担な個人認証の手法として話者認識が注目されている。これまでに、ケプストラムをGMMによりモデル化する手法が提案されている。この手法では全音素を統合して学習、認識を行うが、個人認証を行うには不十分な精度であった。そこで、音素の情報によりモデルを分割し、GMMを学習することで精度の向上を図る。しかしながら、全音素を分割した学習では、モデル数が増加し、学習データが不足するため、認識精度が低下する恐れがある。本研究では、決定木により音素をクラスタリングし、類似した音素を連結学習することにより、この問題を解決する。
- 一般社団法人情報処理学会の論文
- 2012-03-06
著者
関連論文
- A-15-1 コード進行を用いた楽曲のモデル化と楽曲間の類似度に関する研究(A-15.ヒューマン情報処理,一般セッション)
- 日本語歌詞からの自動作曲(音楽とOR)
- Orpheus : 歌詞の韻律に基づいた自動作曲システム(自動作曲)
- 声質と歌唱スタイルを自動学習可能な歌声合成システム(スペシャルセッション・歌情報処理2)
- 第1回 HTSを用いた音声合成システムの構築
- A-15-2 クラシック音楽を対象としたGMMに基づく感性モデルに関する研究(A-15.ヒューマン情報処理,一般セッション)
- HMMに基づく人物や動作の多様性を考慮した手話認識手法(聴覚障害者支援ほか,福祉情報工学一般,地域におけるITサポート(シンポジウムテーマ))
- MSD-HMMによる隠れ領域を考慮した手話動作のモデル化
- HMMを用いた手話単語を構成するサブユニットの自動生成手法
- A-10-3 相互相関関数を用いた混合音の音高・楽器推定(A-10.応用音響,一般セッション)
- 韻律生成HMMのための学習データ作成ツール
- HMM音声合成システム(HTS)の開発(システム,第9回音声言語シンポジウム)
- HMM音声合成システム(HTS)の開発(システム,第9回音声言語シンポジウム)
- HMM音声合成システム(HTS)の開発(システム,第9回音声言語シンポジウム)
- 信頼度尺度に基づく音声認識誤りの検出および誤り訂正(合成, 韻律, 生成, 一般)
- パラメータ共有HMMに基づく音響信号からの自動和音認識の検討
- 視聴覚情報を用いた意図推定の為の決定木に基づく意図境界推定
- 楽譜を考慮した演奏者の統計的モデル化手法の改善と演奏者識別による評価
- 単旋律のパート分配によるアンサンブルのための自動編曲手法
- 楽譜情報のコンテキストクラスタリングに基づく演奏者のモデリング手法
- 声質と歌唱スタイルを自動学習可能な歌声合成システム(スペシャルセッション・歌情報処理2)
- HMMを用いた日変動パターンに基づく環境電磁波のモデル化と異常検出(信号処理,知的マルチメディアシステム,一般)
- HMMを用いた日変動パターンに基づく環境電磁波のモデル化と異常検出(信号処理,知的マルチメディアシステム,一般)
- 変分ベイズ法に基づく声質変換(音声合成・韻律,第9回音声言語シンポジウム)
- 変分ベイズ法に基づく声質変換(音声合成・韻律,第9回音声言語シンポジウム)
- 変分ベイズ法に基づく声質変換(音声合成・韻律,第9回音声言語シンポジウム)
- D-14-4 骨導音声を用いたGMMに基づく話者識別(D-14.音声,一般セッション)
- A-4-29 HMMを用いた日平均情報に基づく環境電磁波の異常放射検出(A-4.信号処理,一般セッション)
- A-4-30 GMMを用いたケプストラムの日平均情報に基づく環境電磁波の分析(A-4.信号処理,一般セッション)
- A-10-3 GMMに基づく演奏者の音楽的逸脱のモデル化(A-10.応用音響,一般セッション)
- D-12-51 雑音の影響による音声と画像のずれをモデル化したバイモーダル大語彙連続音声認識(D-12.パターン認識・メディア理解A(パターンメディアの認識・理解・生成),一般セッション)
- 極低ビットレート音声符号化システムにおける決定木を用いたコードブックの自動決定
- 日本手話の音韻構造を考慮したHMMに基づく手話認識(一般セッション,福祉と見守りのための画像・音声処理)
- 日本手話の音韻構造を考慮したHMMに基づく手話認識(一般セッション,福祉と見守りのための画像・音声処理)
- 日本手話の音韻構造を考慮したHMMに基づく手話認識(一般セッション,福祉と見守りのための画像・音声処理)
- H-028 GMMを用いた環境電磁波の異常検出と地震のエネルギーとの相関(画像認識・メディア理解,一般論文)
- AS-2-10 SOM上の環境電磁波の特徴(AS-2.電磁波地震予知における信号処理の新展開、評価技術,シンポジウム)
- A-4-23 手座標追跡によるジェスチャー認識
- HMM に基づく歌声合成のためのビブラートモデル化
- E-037 コード進行クラスタリングによる楽曲のモデル化と楽曲間類似度の評価(自然言語・音声・音楽,一般論文)
- D-12-124 手話単語認識のためのサブユニットHMMの自動生成(D-12.パターン認識・メディア理解B(コンピュータビジョンとコンピュータグラフィックス),一般セッション)
- A-10-4 環境電磁波のケプストラムを用いたベクトル量子化 : コードワードの解析(A-10.応用音響,一般セッション)
- K-019 手話単語を構成するためのサブユニットHMMの自動生成(教育工学・福祉工学・マルチメディア応用,一般論文)
- A-10-8 混合音の調波構造パターンとの相関による楽器・音高推定(A-10.応用音響,一般セッション)
- K-057 HMMに基づく手の動きと形状特徴のストリーム別クラスタリングを用いた手話認識手法(K分野:教育工学・福祉工学・マルチメディア応用,一般論文)
- F-22 HMM歌声合成における音韻・音高の同時モデル化(音楽情報科学(1),F.音声・音楽)
- HMMに基づく歌声合成のためのビブラートモデル化
- E-029 状態共有型HMMに基づく音楽音響信号からの自動和音認識の検討(E分野:自然言語・音声・音楽,一般論文)
- 5T-3 GMMに基づいた楽曲特徴と感性情報の対応関係のモデル化(音楽信号処理,学生セッション,人工知能と認知科学,情報処理学会創立50周年記念)
- 隠れマルコフモデルに基づいた歌声合成システム(音楽情報科学)
- 隠れマルコフモデルに基づいた歌声合成システム(音楽音響信号認識/生成2)
- K-15 HMMを用いたジェスチャー認識における混合数の検討(ヒューマンコミュニケーション基礎(2),K.ヒューマンコミュニケーション&インタラクション)
- HMMに基づいた視聴覚テキスト音声合成 : 画像ベースアプローチ(音声言語情報処理とその応用)
- 1T-4 単旋律のパート分配と伴奏・副旋律生成によるアンサンブルのための自動編曲手法(音楽分析・生成,学生セッション,人工知能と認知科学,情報処理学会創立50周年記念)
- E-015 発話文における意図識別に有効な音響特徴の検討(E分野:自然言語・音声・音楽,一般論文)
- 1T-7 任意の言葉の印象に合った楽曲生成についての検討(音楽分析・生成,学生セッション,人工知能と認知科学,情報処理学会創立50周年記念)
- HMM に基づいた極低ビットレート音声符号化におけるピッチ情報のベクトル量子化
- CRFに基づく伴奏の演奏表現の予測モデルと協調演奏システム
- 隠れマルコフモデルに基づく指文字合成システムの開発(コミュニケーションの心理及び一般)
- D-12-116 固有ジェスチャーを用いたHMMに基づくジェスチャー認識
- 手話の音韻構造に基づいたHMM手話認識の改善(聴覚障害ほか,視覚障害者支援,福祉情報工学一般)
- 音韻構造を考慮したHMM手話認識における音韻ストリーム重みの最適化手法の検討(手話システム,聴覚障害及び一般)
- 多声MIDI演奏の楽譜追跡における演奏の即興性のモデル化と自動伴奏への応用
- 隠れセミマルコフモデルと線形動的システムを組み合わせた音楽音響信号と楽譜の実時間アライメント手法
- 確率的手法による歌唱曲の自動作曲(音楽制作と情報処理の友好関係)
- 音声合成における声質再現性の分析と評価(一般セッション,合成,生成,韻律,音声一般)
- TOFカメラによる3次元情報を用いた手話認識に関する検討(福祉情報工学一般,ライフイノベーションのための介護・リハビリ・生活支援技術)
- 音声合成における声質再現性の分析と評価
- メロディの調和を考慮した合唱の歌声パートに対する多重音高推定
- メロディの調和を考慮した合唱の歌声パートに対する多重音高推定
- TOFカメラによる3次元情報を用いた手話認識に関する検討
- 音楽要素の分解再構成に基づく日本語歌詞からの旋律自動作曲
- 任意箇所への弾き直し・弾き飛ばしを含む演奏に追従可能な楽譜追跡と自動伴奏
- 楽譜に基づく鍵盤楽器演奏の統計的モデル化手法
- TOFカメラによる手話の言語的特性を考慮した手話認識
- 旋律の演奏表情を考慮した言語モデルに基づく自動伴奏生成
- E-039 パート間の調和を利用した合唱の基本周波数推定の検討(音楽情報科学(MUS),E分野:自然言語・音声・音楽)
- J-041 単語共起頻度データベースを使用した任意の言葉の印象に合った楽曲検索(HCIと自然言語処理,J分野:ヒューマンコミュニケーション&インタラクション)
- E-040 関係調を考慮したパラメータ共有HMMに基づく音響信号の自動和音認識の検討(音楽情報科学(MUS),E分野:自然言語・音声・音楽)
- K-018 TOFカメラによる連続手話認識に関する検討(教育工学(3)&福祉情報工学,K分野:教育工学・福祉工学・マルチメディア応用)
- J-040 決定木に基づく楽曲の印象推定モデルの分類とその評価(HIP(2),J分野:ヒューマンコミュニケーション&インタラクション)
- 隠れマルコフモデルによる習熟度に対応したバイオリン運指推定
- Ryry : 弾き飛ばし・弾き直しを含む演奏に追従する音響信号による自動伴奏システム(音声・福祉一般,音声/福祉/ディジタル信号処理/聴覚一般)
- D-12-9 HMMによる環境電磁波の異常検知と地震前兆信号の判別(D-12.パターン認識・メディア理解A(パターンメディアの認識・理解・生成))
- Ryry : 弾き飛ばし・弾き直しを含む演奏に追従する音響信号による自動伴奏システム(音声・福祉一般,音声/福祉/ディジタル信号処理/聴覚一般)
- 関係調を考慮したHMMに基づく音響信号の自動和音認識と類似曲分類
- E-028 任意の言葉による楽曲検索のための楽曲特徴量の自動選択(E分野:自然言語・音声・音楽)
- E-029 習熟度に応じたバイオリン運指推定のための確率モデルとパラメータ学習(E分野:自然言語・音声・音楽)
- 旋律の演奏特徴量を反映させた作曲支援のための自動伴奏生成
- 季節別の環境電磁波のHMMに基づく異常検出
- 音素決定木に基づくGMMを用いた話者認識