加重等分解度特徴量を用いたテキスト独立型話者識別
スポンサーリンク
概要
- 論文の詳細を見る
本研究では, 話者の生理学的特徴を捉える音響特徴に着目して加重等分解度特徴量を提案し、さらに話者識別システムに取り込み, 話者識別を行った.音声の個人性については, 口・鼻腔の音響結合度合いによりスペクトル上の300Hzと3000Hz付近において極零対が生じ, または, 梨状窩の個人差により4000Hzから6000Hzまでの範囲において特徴的スペクトルが形成されているとの音声生成の研究報告があった.話者の生理学的特徴を取り入れるため上記の周波数領域を局部細分化して話者認識を行ったところ, 高い識別率を得るために, メルフィルタのバンドの最適な細分割数は, 高周波数領域において高くなる傾向になることがわかった.この結果は, 話者個人特徴の詳細を捉えるため, 全周波数領域でメルスケールより線形スケールの方が有効であろうということを示唆する.この知見をもとに, 本研究では, 線形スケールを用い上記の生理学的特徴に関わる周波数領域に大きな重み係数をつけDCTを施して音響特徴量(加重等分解度特徴量)を抽出した.提案した音響特徴量をMFCCと組み合わせたハイブリッドGMMモデルでは, 従来のGMMモデルより話者識別率が顕著に改善された.
- 2005-02-04
著者
-
党 建武
北陸先端科学技術大学院大学
-
Lu X
北陸先端科学技術大学院大学情報科学研究科
-
Lu Xugang
北陸先端科学技術大学院大学情報科学研究科
-
党 建武
北陸先端科学技術大学院大学情報科学研究科:天津大学計算機科学技術学院
-
葭原 康博
北陸先端大
-
葭原 康博
北陸先端科学技術大学院大学情報科学研究科
関連論文
- 高効率エネルギー放射を意図したアンプの研究開発(学生研究発表会)
- D-14-1 素片編集型音声合成における発話スタイルに関する研究(D-14. 音声,一般セッション)
- IECを用いた素片接続コストの重み係数推定
- GMMに基づいた雑音感度関数を用いたロバスト音声認識(聴覚・音声及び一般)
- 母音学習過程における音声知覚と調音変化の関係について
- 3次元MRI動画データと実音声を用いた声道断面積モデルのパラメータ推定
- 3次元舌モデルを用いる母音構音のforce vector及びλvectorに関する検討(音声・聴覚,一般)
- 喉頭モデルでカップリング問題関する数値解析(音声・聴覚,一般)
- 発話機構モデルに基づく音声と調音状態との一対多の関係に関する考察
- 音声と一対多の関係にある調音状態の分布構造 : 発話機構モデルに基づく考察(聴覚・音声・言語とその障害,一般)
- D-14-17 破裂子音の音響特徴に関する研究(D-14. 音声,一般セッション)
- ディジタルオーディオにおける深い感性に関連した音質劣化の原因究明--jitterに起因する音質劣化の仕組みの解明と新改善方法の検討 (特集 感性ロボティクス)
- リアルな発話運動を実現する生理学的口唇力学モデルの構築(バイオサイバネティックス, ニューロコンピューティング)
- 模倣による調音ダイナミクスモデル制御の獲得(「脳・認知科学」及び一般)
- 音声生成における軟口蓋の働きのモデル化に関する研究(音声・聴覚,一般)
- 調音運動ダイナミクスの音声認識への応用(聴覚・音声/一般)
- 調音データに基づいた調音結合の分析
- 発話時舌内部変形のモデルシミュレーションとtagged-MRIによる観測との比較(合成, 生成, 韻律, 一般)
- 音声と一対多の関係にある調音状態の分布構造--発話機構モデルに基づく考察
- 乳幼児の音声模倣能力の獲得過程における調音ジェスチャの役割(聴覚・音声/一般)
- 通常発話状態と特異発話状態との判別基準の検討(聴覚・音声/一般)
- 乳幼児の音声模倣能力の獲得過程における調音ジェスチャの役割
- 通常発話状態と特異発話状態との判別基準の検討
- 日本語5母音の調音・音響的観測とモデルシミュレーションとの比較(音声・聴覚,一般)
- 生理学的発話機構モデルを用いた音響特性と発話状態の関連性の検討
- 生理学的発話機構モデルを用いてQuantal theoryを考慮した音声から発話状態の推定(福祉と音声処理及び一般)
- 生理学的発話機構モデルを用いてQuantal theoryを考慮した音声から発話状態の推定(福祉と音声処理及び一般)
- 生理学的な調音モデルを用いた調音結合のモデル化及びシミュレーション
- 音響パプメータと調音パラメータの結合を考慮した音声認識(聴覚・音声・言語とその障害)
- 加重等分解度特徴量を用いたテキスト独立型話者識別
- 発話運動における調音結合の分析について
- 加重等分解度特徴量を用いた話者識別
- 生理学的特徴量の話者識別における有効性についての検討
- 復唱による母音学習過程における音声知覚に関する考察
- ディジタルオーディオにおける深い感性に関連した音質劣化の原因究明--jitterに起因する音質劣化の仕組みの解明と新改善方法の検討 (特集 感性ロボティクス)
- MR画像に基づいた変形による生理学的発話機構モデルの個人化(オーガナイズドセッション「音声知覚生成インタラクション・音声認識合成統合技術」,音声知覚生成/聴覚コミュニケーション,一般)