SNRの変化に適応するSS法による雑音混入音声の認識(福祉と知能・情動・認知障害,福祉と音声処理,一般)
スポンサーリンク
概要
- 論文の詳細を見る
スペクトルサブトラクション法は定常性の高い雑音に対して有効な方法として知られている.しかし,実雑音環境下では必ずしも定常性が保たれる訳ではない.そこで,雑音のパワー変動に対処するため,変動に対応した変数を最適化問題により求め,識別性能の向上を試みる.また,最適化問題を解く上で出現する無理関数をテイラー展開を用いて近似することで,観測音と推定した雑音のみに依存し音響モデルに依存しない計算を増やすことで,行列計算のみによる計算が可能となり,計算速度が向上することを示す.その結果,雑音下音声認識評価環境(AURORA-2J)を用いた単語識別実験において近似を用いない場合にはSNRが0dB,10dB,20dBの場合にそれぞれ23%,77%,97%の識別率を得た.近似を用いた場合,それらには及ばないものの,SNRが20dBの場合を除きBase lineより高い識別率が得られた.
- 社団法人電子情報通信学会の論文
- 2008-01-18
著者
関連論文
- ウエーブレットパケット解析を用いた音声符号化
- 両方向 N-gram 確率を用いた誤り文字検出法(自然言語処理)
- 両方向N-gram確率を用いた確率変化パターンによる誤り検出(テーマセッション(1))(データマイニングとパターン認識・メディア理解)
- Webデータベース汎用システムの開発と音声データ管理システムとしての利用(テーマセッション: Web, データ工学とメディア理解との融合)
- 識別情報を利用したクラス情報のグラフ表示
- グラフによる多次元データの構造解析
- 体積プロトタイプの解析と混合分布モデルとの比較(一般セッション,データ工学とメディア理解との融合)
- 体積プロトタイプの解析と混合分布モデルとの比較(一般セッション,データ工学とメディア理解との融合)
- Webデータベース汎用システムの開発と音声データ管理システムとしての利用(テーマセッション: Web, データ工学とメディア理解との融合)
- 音声分析のための Web-データベース連携システムの検討
- 位相を考慮したスペクトルサブトラクションを用いた単語認識
- パターン認識問題における終端条件の付加によるk近隣法の高速化
- スプライン曲面を用いた画像の2チャネル符号化
- 聴覚フィルタ出力に補正を施した音声認識
- 通過領域に着目した多次元空間における曲線分類
- 連母音の挙動に含まれる個人性情報の抽出
- 分枝限定法利用の最近隣法における終端条件の効果
- 複数領域の隣接関係に基づく自然シーンの高速ラベリング
- 非線形変換を用いた連母音わたり部の挙動推定
- 非線形識別関数のための特徴選択
- 顔の幾何学的特徴による個人識別
- 領域の隣接関係を用いたラベル画像の生成
- 特殊な合成母音における音素境界の曖昧さ
- 無声母音のピッチと音韻性に対するホルマント周波数とスペクトルの傾斜の影響
- 無声母音のホルマント周波数と音韻性に関する検討
- 音響を利用した掃流砂観測手法の開発
- 圧力センサを用いた着席者の姿勢識別に関する研究(ユビキタス・センサネットワークの要素技術,コンテクストの抽出,スマートスペース,ユビキタス生活支援,一般)
- 圧力センサを用いた着席者の姿勢識別に関する研究(ユビキタス・センサネットワークの要素技術,コンテクストの抽出,スマートスペース,ユビキタス生活支援,一般)
- 音響管モデルに束縛を与えた音声合成(合成,生成,韻律,一般)
- SNRの変化に適応するSS法による雑音混入音声の認識(福祉と知能・情動・認知障害,福祉と音声処理,一般)
- SNRの変化に適応するSS法による雑音混入音声の認識(福祉と知能・情動・認知障害,福祉と音声処理,一般)
- SNRの変化に適応するSS法による雑音混入音声の認識(福祉と知能・情動・認知障害,福祉と音声処理,一般)
- S/N比に自動適合するHMM合成法を用いた単語認識
- S/N比に自動適合するHMM合成法を用いた単語認識
- 劣決定信号復元における最小l_1ノルム系列の効率的構成(一般セッション(8))(データマイニングとパターン認識・メディア理解)
- モデル選択基準を用いた非線形識別関数の構成
- 孤立発声母音を用いた聴覚モデルによる話者認識
- スプライン曲面を使った画像情報の圧縮
- 同時マスキングモデルによる母音の特徴抽出
- 連母音わたり部の挙動を利用した後続母音の認識
- 後舌母音の知覚に及ぼす基本周波数と遮断周波数の影響
- 聴覚モデルによる母音の特徴周波数の抽出
- 母音の音韻性におよぼす継続時間の影響
- 幾何学モデルを用いた連母音わたり部の挙動推定
- マスキングモデルによる子音の認識
- 二次遅れを考慮したニューラルネットワークによる時系列の学習
- 所属性質問を利用した区分的線形識別規則の追加学習
- 統計的弛緩法による図形分節モデル
- 時変パラメータを用いた母音および半母音の認識 (情報工学専攻創立20周年記念号)
- 音源の個人性を考慮した声質変換(一般(ポスターセッション),第12回音声言語シンポジウム:情報アクセス,音声・言語処理一般)
- 音源の個人性を考慮した声質変換(一般(ポスターセッション),第12回音声言語シンポジウム:情報アクセス,音声・言語処理一般)