生理学的特徴量の話者識別における有効性についての検討
スポンサーリンク
概要
- 論文の詳細を見る
本稿では,生理学的特徴量を従来の話者識別システムに取り込み,話者識別に対する有効性について報告する.生理学的特徴量の一つとしては,発声時の鼻腔と口腔との結合度合により,3000Hz付近の周波数領域に極零対を起こすことが従来の研究により明らかになった.この知見に基づき,本研究ではケプストラム法に基づいて局部細分化により鼻腔の結合に関する情報の抽出法を提案した.メルケプストラム抽出過程において,3000Hz付近(2700Hzから3300Hz)におけるメル尺度分析帯域幅をさらに線形的に細分割し,周波数分解能を高めることによって,積極的にその帯域のスペクトル情報を抽出する.標準メルケプストラム係数(従来法)と局部細分化したケプストラム法(提案法)を特徴量として,ハイブリツトGMMに基づくテキスト独立型話者識別実験を行った.ここで,同条件のもとで,従来法のみを用いた場合,従来法と基本周波数を組み合わせた場合,従来法に線形予測残差ケプストラム係数を取り入れた場合の識別率をそれぞれ求め,本提案法と比較した.その結果,提案法は,従来法のみの場合,または従来法に基本周波数を取り入れた場合より高い識別精度が得られたので,その有効性を確認できた.
- 社団法人電子情報通信学会の論文
- 2004-07-16
著者
-
党 建武
北陸先端科学技術大学院大学
-
ルー シュガン
北陸先端科学技術大学院大学情報科学研究科
-
Lu Xugang
北陸先端大
-
Lu Xugang
北陸先端科学技術大学院大学情報科学研究科
-
党 建武
北陸先端科学技術大学院大学情報科学研究科:天津大学計算機科学技術学院
-
葭原 康博
北陸先端大
-
葭原 康博
北陸先端科学技術大学院大学情報科学研究科
関連論文
- 高効率エネルギー放射を意図したアンプの研究開発(学生研究発表会)
- D-14-1 素片編集型音声合成における発話スタイルに関する研究(D-14. 音声,一般セッション)
- IECを用いた素片接続コストの重み係数推定
- GMMに基づいた雑音感度関数を用いたロバスト音声認識(聴覚・音声及び一般)
- 母音学習過程における音声知覚と調音変化の関係について
- 残響環境に頑健な音声認識のための前処理 : 音声特有の特徴の利用(認識,理解,対話,一般)
- 3次元MRI動画データと実音声を用いた声道断面積モデルのパラメータ推定
- 3次元舌モデルを用いる母音構音のforce vector及びλvectorに関する検討(音声・聴覚,一般)
- 喉頭モデルでカップリング問題関する数値解析(音声・聴覚,一般)
- 発話機構モデルに基づく音声と調音状態との一対多の関係に関する考察
- 音声と一対多の関係にある調音状態の分布構造 : 発話機構モデルに基づく考察(聴覚・音声・言語とその障害,一般)
- D-14-17 破裂子音の音響特徴に関する研究(D-14. 音声,一般セッション)
- ディジタルオーディオにおける深い感性に関連した音質劣化の原因究明--jitterに起因する音質劣化の仕組みの解明と新改善方法の検討 (特集 感性ロボティクス)
- リアルな発話運動を実現する生理学的口唇力学モデルの構築(バイオサイバネティックス, ニューロコンピューティング)
- 模倣による調音ダイナミクスモデル制御の獲得(「脳・認知科学」及び一般)
- 音声生成における軟口蓋の働きのモデル化に関する研究(音声・聴覚,一般)
- 調音運動ダイナミクスの音声認識への応用(聴覚・音声/一般)
- 線形予測分析に基づいた骨導音声ブラインド回復法の総合的評価(音声生成・知覚,聴覚心理,音声学・音韻論,一般)
- 調音データに基づいた調音結合の分析
- 発話時舌内部変形のモデルシミュレーションとtagged-MRIによる観測との比較(合成, 生成, 韻律, 一般)
- 音声と一対多の関係にある調音状態の分布構造--発話機構モデルに基づく考察
- 雑音残響環境下での変調伝達関数に基づくパワーエンベロープ回復処理と音声認識への応用 (音声)
- 雑音残響環境下での変調伝達関数に基づくパワーエンベロープ回復処理と音声認識への応用 (信号処理)
- 雑音残響環境下での変調伝達関数に基づくパワーエンベロープ回復処理と音声認識への応用 (応用音響)
- 乳幼児の音声模倣能力の獲得過程における調音ジェスチャの役割(聴覚・音声/一般)
- 通常発話状態と特異発話状態との判別基準の検討(聴覚・音声/一般)
- 乳幼児の音声模倣能力の獲得過程における調音ジェスチャの役割
- 通常発話状態と特異発話状態との判別基準の検討
- 日本語5母音の調音・音響的観測とモデルシミュレーションとの比較(音声・聴覚,一般)
- 生理学的発話機構モデルを用いた音響特性と発話状態の関連性の検討
- 生理学的発話機構モデルを用いてQuantal theoryを考慮した音声から発話状態の推定(福祉と音声処理及び一般)
- 生理学的発話機構モデルを用いてQuantal theoryを考慮した音声から発話状態の推定(福祉と音声処理及び一般)
- 聴覚系と発話系の相互作用に関する検討
- 生理学的な調音モデルを用いた調音結合のモデル化及びシミュレーション
- 音響パプメータと調音パラメータの結合を考慮した音声認識(聴覚・音声・言語とその障害)
- 加重等分解度特徴量を用いたテキスト独立型話者識別
- 発話運動における調音結合の分析について
- 雑音残響環境下での変調伝達関数に基づくパワーエンベロープ回復処理と音声認識への応用(オーガナイズドセッション:スピーチエンハンスメント,音声・音響信号処理,音声及び一般)
- 雑音残響環境下での変調伝達関数に基づくパワーエンベロープ回復処理と音声認識への応用(オーガナイズドセッション:スピーチエンハンスメント,音声・音響信号処理,音声及び一般)
- 雑音残響環境下での変調伝達関数に基づくパワーエンベロープ回復処理と音声認識への応用(オーガナイズドセッション:スピーチエンハンスメント,音声・音響信号処理,音声及び一般)
- 加重等分解度特徴量を用いた話者識別
- 生理学的特徴量の話者識別における有効性についての検討
- 変調伝達関数に基づいたパワーエンベロープ回復処理における音声区間検出の検討 (応用音響)
- 変調伝達関数に基づいたパワーエンベロープ回復処理における音声区間検出の検討 (音声)
- 復唱による母音学習過程における音声知覚に関する考察
- ディジタルオーディオにおける深い感性に関連した音質劣化の原因究明--jitterに起因する音質劣化の仕組みの解明と新改善方法の検討 (特集 感性ロボティクス)
- 変調伝達関数に基づいたパワーエンベロープ回復処理における音声区間検出の検討(一般,音声・音響信号処理,音声及び一般)
- 変調伝達関数に基づいたパワーエンベロープ回復処理における音声区間検出の検討(一般,音声・音響信号処理,音声及び一般)
- 変調伝達関数に基づいたパワーエンベロープ回復処理における音声区間検出の検討(一般,音声・音響信号処理,音声及び一般)
- MR画像に基づいた変形による生理学的発話機構モデルの個人化(オーガナイズドセッション「音声知覚生成インタラクション・音声認識合成統合技術」,音声知覚生成/聴覚コミュニケーション,一般)
- MTFに基づいたパワーエンベロープ回復処理における統合的な雑音残響除去(異種メディア融合,コンテンツ処理,メディア検索,電子透かし,一般)
- MTFに基づいたパワーエンベロープ回復処理における統合的な雑音残響除去(異種メディア融合,コンテンツ処理,メディア検索,電子透かし,一般)