位相を考慮したスペクトルサブトラクションを用いた単語認識
スポンサーリンク
概要
- 論文の詳細を見る
雑音環境下における音声認識の手法としてスペクトルサブトラクション法がよく用いられる.従来のスペクトルサブトラクション法は音声と雑音が無相関であることを仮定している.これは音声と雑音の位相差を±π/2と見なしていることと同義となってしまい,真の雑音を正しく推定できたとしても推定音声は真の音声と雑音の位相差に大きく影響を受けてしまう結果となる.そこで,音声と雑音の位相差を考慮することによりミッシングの影響を低減させる.さらに,雑音混入音声に雑音加えるとS/N比が約6dB低下することを利用し,雑音混入音声.に位相を考慮して雑音を加えた音声のスペクトル包絡が最も雑音のスペクトル包絡に近づく雑音の逆位相を雑音混入音声から引き去ることにより推定音声を求める.LPCケプストラムを用いてこの有効性を評価することは難しいため,ケプストラムを用いて推定雑音の誤差を評価する.また,単語認識実験により単語正解率が改善されることを示す.
- 社団法人電子情報通信学会の論文
- 2002-08-23
著者
関連論文
- ウエーブレットパケット解析を用いた音声符号化
- 両方向 N-gram 確率を用いた誤り文字検出法(自然言語処理)
- 両方向N-gram確率を用いた確率変化パターンによる誤り検出(テーマセッション(1))(データマイニングとパターン認識・メディア理解)
- Webデータベース汎用システムの開発と音声データ管理システムとしての利用(テーマセッション: Web, データ工学とメディア理解との融合)
- 哺乳類における5'-スプライスサイトの配列パターンの位置木による解析
- 識別情報を利用したクラス情報のグラフ表示
- グラフによる多次元データの構造解析
- 体積プロトタイプの解析と混合分布モデルとの比較(一般セッション,データ工学とメディア理解との融合)
- 体積プロトタイプの解析と混合分布モデルとの比較(一般セッション,データ工学とメディア理解との融合)
- Webデータベース汎用システムの開発と音声データ管理システムとしての利用(テーマセッション: Web, データ工学とメディア理解との融合)
- 音声分析のための Web-データベース連携システムの検討
- 位相を考慮したスペクトルサブトラクションを用いた単語認識
- パターン認識問題における終端条件の付加によるk近隣法の高速化
- スプライン曲面を用いた画像の2チャネル符号化
- 聴覚フィルタ出力に補正を施した音声認識
- 通過領域に着目した多次元空間における曲線分類
- 連母音の挙動に含まれる個人性情報の抽出
- 分枝限定法利用の最近隣法における終端条件の効果
- 複数領域の隣接関係に基づく自然シーンの高速ラベリング
- 非線形変換を用いた連母音わたり部の挙動推定
- 非線形識別関数のための特徴選択
- 顔の幾何学的特徴による個人識別
- 領域の隣接関係を用いたラベル画像の生成
- 特殊な合成母音における音素境界の曖昧さ
- 無声母音のピッチと音韻性に対するホルマント周波数とスペクトルの傾斜の影響
- 無声母音のホルマント周波数と音韻性に関する検討
- 音響を利用した掃流砂観測手法の開発
- 極小値集合による単峰性および多峰性関数の定義とその性質
- 単峰領域の概念に基づく一変数多峰性関数の複数極大点および最大点探索手法
- 平坦な領域をもつ一変数多峰性関数の極小領域探索法
- 二変数多峰性関数の最小値探索アルゴリズム
- 単峰領域の概念を用いた一変数多峰性関数の最大点探索手法
- 凸包によるクラス領域の近似
- 混合分布を用いた識別規則における最適な混合数の選択
- 手書き漢字同定のための動的モデルによるストローク抽出
- 識別問題におけるMDL基準を用いたクラスタリング法
- ボルテラ級数を用いた非線形画像後元
- 画像の小領域に基づく復元フィルタの構成
- 緩和型神経回路モデルによる図形分節候補抽出
- 圧力センサを用いた着席者の姿勢識別に関する研究(ユビキタス・センサネットワークの要素技術,コンテクストの抽出,スマートスペース,ユビキタス生活支援,一般)
- 圧力センサを用いた着席者の姿勢識別に関する研究(ユビキタス・センサネットワークの要素技術,コンテクストの抽出,スマートスペース,ユビキタス生活支援,一般)
- 単峰領域の概念に基づくmultistart法を用いた多峰性関数の大域的最適解の求解に関する考察
- 音響管モデルに束縛を与えた音声合成(合成,生成,韻律,一般)
- SNRの変化に適応するSS法による雑音混入音声の認識(福祉と知能・情動・認知障害,福祉と音声処理,一般)
- SNRの変化に適応するSS法による雑音混入音声の認識(福祉と知能・情動・認知障害,福祉と音声処理,一般)
- SNRの変化に適応するSS法による雑音混入音声の認識(福祉と知能・情動・認知障害,福祉と音声処理,一般)
- S/N比に自動適合するHMM合成法を用いた単語認識
- S/N比に自動適合するHMM合成法を用いた単語認識
- 劣決定信号復元における最小l_1ノルム系列の効率的構成(一般セッション(8))(データマイニングとパターン認識・メディア理解)
- モデル選択基準を用いた非線形識別関数の構成
- 孤立発声母音を用いた聴覚モデルによる話者認識
- スプライン曲面を使った画像情報の圧縮
- 同時マスキングモデルによる母音の特徴抽出
- 連母音わたり部の挙動を利用した後続母音の認識
- 後舌母音の知覚に及ぼす基本周波数と遮断周波数の影響
- 聴覚モデルによる母音の特徴周波数の抽出
- 母音の音韻性におよぼす継続時間の影響
- 幾何学モデルを用いた連母音わたり部の挙動推定
- マスキングモデルによる子音の認識
- 二次遅れを考慮したニューラルネットワークによる時系列の学習
- 所属性質問を利用した区分的線形識別規則の追加学習
- 統計的弛緩法による図形分節モデル
- 時変パラメータを用いた母音および半母音の認識 (情報工学専攻創立20周年記念号)
- 微分を用いない関数最小化におけるPowell法の拡張について
- 平行超平面を用いたPowell法について
- 極小値が単峰列となる多峰関数の大域的最適化手法(1) : 単峰領域幅が等しい目的関数の大域的最適化(数値計算,数理計画法)
- 音源の個人性を考慮した声質変換(一般(ポスターセッション),第12回音声言語シンポジウム:情報アクセス,音声・言語処理一般)
- 音源の個人性を考慮した声質変換(一般(ポスターセッション),第12回音声言語シンポジウム:情報アクセス,音声・言語処理一般)