法科学的話者照合のための標準化・正規化クロスVQ歪みの利用
スポンサーリンク
概要
- 論文の詳細を見る
本論文では,二つの音声資料が同一の話者によって発声されたものであるか否かを判断する法科学的な話者照合手法を提案する。提案手法は,照合する音声資料の一方で作成したVQコードブックと他方の音声資料との間で相互に求めたVQ歪みを利用するものである。このVQ歪みは,二つの音声資料を学習用,テスト用として役割を交換して相互に求めるもので,クロスVQ歪みと呼ぶ。ここでは,多数話者コードブックに対するVQ歪みで正規化した正規化クロスVQ歪みと標準化・正規化変換を施した標準化・正規化クロスVQ歪みの2種類について検討する。10秒程度以下の発話を対象としたテキスト独立型話者照合実験を行った結果,単純なクロスVQ歪みよりも正規化クロスVQ歪みや標準化・正規化クロスVQ歪みを利用することによって,最大7ポイント程度の話者照合率の向上が認められた。また,発話が短いほど,GMMに対する提案法の優位性が明らかとなった。標準化・正規化変換によって,発話長や発話内容の違いによるしきい値の変動が小さくなったことから,提案法は,発話内容や発話長を制御することができない法科学分野において有効な手法であることが示された。
- 社団法人日本音響学会の論文
- 2007-12-01
著者
-
長内 隆
科学警察研究所
-
谷本 益巳
科学警察研究所
-
尾関 和彦
電気通信大学電気通信学部情報通信工学科
-
尾関 和彦
電気通信大学情報工学専攻
-
尾上 和穂
NHK技研
-
谷本 益巳
科学警察研究所法科学第四部情報科学第三研究室
関連論文
- 大規模話者骨導音声データベースを用いたテキスト独立型話者照合実験(一般(ポスターセッション),第9回音声言語シンポジウム)
- 大規模話者骨導音声データベースの構築と予備的な解析(聴覚・音声/一般)
- 雑音環境下における話者照合(聴覚・音声・言語とその障害,一般)
- 大規模話者骨導音声データベースの構築と予備的な解析
- 母音による話者認識における特徴量変換(「感性情報処理の基礎と応用」及びヒューマン情報処理一般)
- 帯域フィルタ出力の時間変化特徴量を利用した音声認識(音声,聴覚)
- 可変長サブワードHMMに基づく未知語処理を導入した音声認識(第8回音声言語シンポジウム)
- 可変長サブワードHMMに基づく未知語処理を導入した音声認識(Session-6 音声認識,第8回音声言語シンポジウム)
- D-14-8 累積音素尤度によるオンライン発話検出と男女音声認識(D-14.音声・聴覚,一般講演)
- 帯域フィルタ出力の時間変化特徴量を利用したニュース音声認識(Session-8 ポスターセッション: 一般, 第7回音声言語シンポジウム)
- 実況・対談における発声変形を考慮した音響モデルの検討(Session-1 音響モデル・特徴量・学習, 第7回音声言語シンポジウム)
- 複数の信頼度尺度を統合した音声認識(ポスターセッション)(第6回音声言語シンポジウム)
- 法科学的話者照合のための標準化・正規化クロスVQ歪みの利用
- 単独発声母音を用いた話者照合における特徴量変換
- 単独発声母音による話者検索の登録話者依存性
- 連続音声中の母音の類似度に関する一考察
- 単文中の母音を用いた話者照合
- 判別関数を用いた不特定話者母音認識
- 音声聴取の主観的評価に及ぼす電話系の影響
- 単独発声単語を用いた話者照合におけるHMMの適用方法の検討
- 筆者識別結果からみた手書き漢字の部分構造と全体構造との関連
- たばこによる可燃物への着火性に関する研究-2-掛布団及び敷布団の着火性について
- 平面マイクロホンアレーの指向特性を考慮した音源のパワー推定
- A-10-7 マイクロホンアレーを用いた到来方向推定における感度位相補正について
- A-10-6 MUSIC法による低周波音のパワー推定
- 音波到来方向推定におけるマイクロホン間の位相差による影響について
- 遺伝的アルゴリズムを用いた空間平均法の最適化
- 平面マイクロホンアレーによる音源のパワー推定
- リニアアレーを用いた移動音源の方向推定
- 平面アレーを用いた静止音源の2次元方向推定
- D-14-5 音声における双子話者の類似性
- マイクロホンアレーによる移動音源の速度推定
- 500円硬貨の音響特性
- HAAR変換によって生じた極の変化に着目した教師信号の作成
- LPC分析における極に着目した教師信号の作成に関する研究
- HAAR変換の字数による単語抽出への影響
- D-14-11 Haar変換による時系列フィルタの作成
- D-14-19 LPC分析によるフィルタのパラメータ設定
- LPC係数を用いたガンマトーンフィルタの作成
- 単語認識に及ぼすフィルタバンク出力の時間平滑化の影響
- 舌の側面輪郭の2次曲線による近似
- 言い換えを利用したリスピーク方式によるスポーツ中継のリアルタイム字幕制作(音声,聴覚)
- フィルターバンクサブトラクションによる雑音環境下の音声認識 (音声認識による字幕サービス 特集号)
- 生字幕放送のための音声認識 : システムの概要とリスピークの効果
- 連続音声認識における動的特徴量の高精度な計算法
- 大規模話者骨導音声データベースを用いたテキスト独立型話者照合実験(一般(ポスターセッション),第9回音声言語シンポジウム)
- 大規模話者骨導音声データベースを用いたテキスト独立型話者照合実験(一般(ポスターセッション),第9回音声言語シンポジウム)
- 可変長サブワードHMMに基づく未知語処理を導入した音声認識(Session-6 音声認識,第8回音声言語シンポジウム)
- 帯域フィルタ出力の時間変化特徴量を利用したニュース音声認識(Session-8 ポスターセッション: 一般, 第7回音声言語シンポジウム)
- 雑音環境下単語認識のための複素周波数領域における参照再構成法
- マルチSNR・マルチバンド法を用いた話者識別における様々な学習雑音に対する性能評価
- マルチSNR部分帯域モデルを用いた話者識別システムの耐雑音性能改善
- マルチSNR部分帯域モデルを用いた雑音環境下での話者識別
- マルチSNR部分帯域GMMを用いた雑音環境下での話者認識
- マルチSNR部分帯域GMMを用いた雑音環境下での話者認識
- 日本語連続音声認識におけるスコア関数の比較
- 雑音環境下における話者照合
- テキスト依存型話者照合におけるしきい値と話者の関係
- 雑音低減のための複素周波数領域における参照再構成法(第8回音声言語シンポジウム)
- 雑音低減のための複素周波数領域における参照再構成法(Session-4 一般(ポスターセッション),第8回音声言語シンポジウム)
- 雑音低減のための複素周波数領域における参照再構成法(Session-4 一般(ポスターセッション),第8回音声言語シンポジウム)
- 雑音低減のための複素周波数領域における参照再構成法
- 話し言葉コーパスの係り受け解析を目的とした韻律の分析
- [若手研究者育成レクチャーシリーズ]韻律と統語構造
- 韻律情報を用いた日本語読み上げ文の係り受け解析におけるニューラルネットワークの利用
- 日本語読み上げ文の係り受け解析における複数ポーズ情報の利用
- 文節間係り受け整合度と文節重要度を用いて自動簡約した日本語文の主観評価
- 韻律を利用した係り受け解析におけるポーズ・基本周波数情報の結合法の検討
- 日本語読み上げ文の係り受け解析における韻律的特徴量の有効性
- 係り受け解析におけるポーズ・ピッチの利用法の検討
- 文節重要度と係り受け整合度に基づく日本語文簡約アルゴリズム
- 帯域フィルタ出力の時間変化特徴量を利用したニュース音声認識(Session-8 ポスターセッション: 一般, 第7回音声言語シンポジウム)
- 実況・対談における発声変形を考慮した音響モデルの検討(Session-1 音響モデル・特徴量・学習, 第7回音声言語シンポジウム)
- 実況・対談における発声変形を考慮した音響モデルの検討(Session-1 音響モデル・特徴量・学習, 第7回音声言語シンポジウム)
- 誤認識関数を最小化する標準パターン学習アルゴリズム
- 音響尤度補正による雑音環境下の音声認識の改善
- 雑音モデルに基づく補正音響尤度を用いた音声認識(雑音下音声処理)(第6回音声言語シンポジウム)
- 複数の信頼度尺度を統合した音声認識(ポスターセッション)(第6回音声言語シンポジウム)
- 雑音モデルに基づく補正音響尤度を用いた音声認識(雑音下音声処理)(第6回音声言語シンポジウム)
- 複数の信頼度尺度を統合した音声認識(ポスターセッション)(第6回音声言語シンポジウム)
- 雑音モデルに基づく補正音響尤度を用いた音声認識(雑音下音声処理)(第6回音声言語シンポジウム)
- A-10-4 平面マイクロホアレーを用いたMUSICによる騒音発生源の2次元方向推定
- 真の認識率の事後確率に基づく認識システムの性能比較
- 決定木による日本語長文の短文分割
- 分類木を用いた日本語文の自動文節分割
- 文節間係り受け距離の統計的性質を用いた日本語文の係り受け解析
- 文節間係り受け距離の統計的性質とその係り受け解析への応用
- 話者認識における話者数と認識率の信頼性との関係
- アフィン変換を用いた音声特徴量の正規化
- 選択学習による音響モデルの適応化 (音声認識による字幕サービス 特集号)
- 日本語母語話者・非母語話者による電話番号読み上げ音声の韻律(オーガナイズドセッション2,聴覚・音声・言語とその障害/一般)
- 文節重要度と係り受け整合度に基づいた文簡約実験
- 1994年音声言語処理国際会議
- 連続音声の多群分割によるテキスト独立型話者照合
- 単独発声母音の隠れマルコフモデルを用いた短文章による話者照合
- 動的計画法に基づく単独発声単語を用いたテキスト依存型話者照合
- ニュース音声認識における言語モデルの検討
- ニュース音声認識における言語モデルの検討
- 法科学分野における話者認識の動向(話者認識に関する研究の動向)
- 話者認識技術の現状と課題(オーガナイズドセッション(パネルディスカッション),音声アプリケーション,一般)