非負値行列因子分解を用いた音素配列情報の抽出による言語識別の検討(ポスターセッション,第13回音声言語シンポジウム)
スポンサーリンク
概要
- 論文の詳細を見る
言語識別とは,発話内容に係わらず入力音声の言語を識別する技術である.本研究では音素配列を特徴量として言語識別に利用する.音素配列を得るためには,発話データから音素の出現情報の抽出を行う必要がある.その抽出方法として,テンプレートを用いた非負値行列因子分解を用いる.抽出した音素の出現情報を用いて配列パターンをモデル化するためにn-gramを使用する.n-gramのパラメータを特徴ベクトルとしてサポートベクタマシーンで言語識別を行う.提案手法を用いて,日本語と英語で言語識別を識別を行った.その結果,テンプレート数とn-gramの次数によって識別性能が変化することが確認された.テンプレート数が13, n-gramの次数が3のとき98.6%の識別率を得た.
- 2011-12-12
著者
関連論文
- 雑音環境下単語認識のための複素周波数領域における参照再構成法
- マルチSNR・マルチバンド法を用いた話者識別における様々な学習雑音に対する性能評価
- マルチSNR部分帯域モデルを用いた話者識別システムの耐雑音性能改善
- マルチSNR部分帯域モデルを用いた雑音環境下での話者識別
- フレーム単位で最適 SNR 部分帯域モデルを選択する話者認識
- マルチSNR部分帯域GMMを用いた雑音環境下での話者認識
- マルチSNR部分帯域GMMを用いた雑音環境下での話者認識
- 雑音低減のための複素周波数領域における参照再構成法(第8回音声言語シンポジウム)
- 雑音低減のための複素周波数領域における参照再構成法(Session-4 一般(ポスターセッション),第8回音声言語シンポジウム)
- 雑音低減のための複素周波数領域における参照再構成法(Session-4 一般(ポスターセッション),第8回音声言語シンポジウム)
- 雑音低減のための複素周波数領域における参照再構成法
- 話し言葉コーパスの係り受け解析を目的とした韻律の分析
- 韻律情報を用いた日本語読み上げ文の係り受け解析におけるニューラルネットワークの利用
- 日本語読み上げ文の係り受け解析における複数ポーズ情報の利用
- 文節間係り受け整合度と文節重要度を用いて自動簡約した日本語文の主観評価
- 韻律を利用した係り受け解析におけるポーズ・基本周波数情報の結合法の検討
- 日本語読み上げ文の係り受け解析における韻律的特徴量の有効性
- 係り受け解析におけるポーズ・ピッチの利用法の検討
- 文節重要度と係り受け整合度に基づく日本語文簡約アルゴリズム
- 文節重要度と係り受け整合度に基づいた文簡約実験
- 雑音重畳音声の認識における連語言語モデルの比較
- 間投詞・非流暢発話と休止による対話音声区分化の検討
- ニュース音声認識における言語モデルの検討
- ニュース音声認識における言語モデルの検討
- ニュース音声認識における言語モデルの検討
- 非負値行列因子分解を用いた音素配列情報の抽出による言語識別の検討(ポスターセッション,第13回音声言語シンポジウム)
- 非負値行列因子分解を用いた音素配列情報の抽出による言語識別の検討(ポスターセッション,第13回音声言語シンポジウム)
- 非負値行列因子分解を用いた音素配列情報の抽出による言語識別の検討
- 非負値行列因子分解を用いた音素配列情報の抽出による言語識別の検討