低域スペクトルの予測残差を利用した非定常高騒音環境での有声音区間の検出
スポンサーリンク
概要
- 論文の詳細を見る
非定常騒音は雑音のパワーレベルの変動が激しく, 周波数スペクトルも多様であるため, 定常雑音を仮定した音声区間検出法では, 十分な音声区間の検出精度を得ることは困難である. また, 高騒音環境下では無声音は雑音と区別しにくく, 無声音を含めた区間検出では誤検出が避けられない. これらの問題に対して, 有声音特有の高調波構造に着目し低域周波数帯における線形予測モデルの予測残差を利用することによって, 有声音区間を検出する手法を提案する. 線形予測分析の対象とする周波数帯域を低域に限定することにより, 広帯域を使用する場合と比較して有声音と雑音の分離特性が向上すると共に, 計算量も低減する. 機械加工工場の非定常騒音環境下で男性話者3名がそれぞれ発声した100単語を用いた実験によると, 単語区間 (無声音区間を除く) の検出率79.0%が得られ, 本手法の有効性が確認された.
- 1997-01-25
著者
関連論文
- 最小分類誤り学習の汎化能力改善とニューラルネットワークへの応用
- ストロークHMMに基づくオンライン手書き文字認識の特徴量の検討
- 文クラスタリングによる複数言語モデルを用いた誤認識文の推定
- 最尤推定を用いた声道長線形変換による話者正規化(音声言語情報処理とその応用)
- 最尤推定に基づく線形変換を用いた声道長正規化
- 最尤推定に基づく線形変換を用いた声道長正規化
- 最尤推定に基づく線形変換を用いた声道長正規化
- ストロークHMMオンライン文字認識方式の階層構造辞書を用いた筆順違い対策
- H-16 2次元Warpingを用いた頸椎X線画像の骨年齢評価(医用画像処理,H.生体情報科学)
- 階層的な文字部品間の位置関係を選択的に利用したオンライン手書き文字認識(一般セッション)
- 階層的な文字部品間の位置関係を選択的に利用したオンライン手書き文字認識(一般セッション)
- 環境依存型サブストロークHMMを用いたオンライン手書き文字認識(画像認識, コンピュータビジョン)
- サブストロークHMMを用いたオンライン手書き文字認識(画像認識, コンピュータビジョン)
- D-12-84 パターン間の合成写像を用いた非線形時間伸縮法の高速化(D-12.パターン認識・メディア理解A)
- 非同期遷移型HMMによる音声認識
- 確率的シソーラスに基づいたトリガー言語モデルの拡張
- ウェアラブル環境を想定した視覚障害者用オンライン手書き文字入力インタフェース
- 発声変形に対するヤコビ適応法
- 擬人化音声対話エージェントにおけるモジュール統合処理
- ストロークHMMを用いたオンライン重ね書き文字列認識
- ストロークHMMを用いたオンライン重ね書き文字列認識
- ストロークHMMを用いたオンライン重ね書き文字列認識
- 擬人化音声対話エージェントにおける発話時の頭部挙動モデル
- 隠れマルコフモデルによる音楽リズムの認識(音楽情報科学)
- 筆圧情報を併用したストロークHMMに基づくオンライン文字認識
- 文クラスタリングによる複数言語モデルを用いた誤認識文の推定
- 文クラスタリングによる複数言語モデルを用いた誤認識文の推定
- 複数の特徴ベクトル軌道を持つ環境依存音素クラスタの生成
- 環境依存型ストロークHMMを用いたオンライン手書き文字認識
- 状態遷移に順序関係を持つ非同期遷移型HMM
- 特徴量間で状態遷移が非同期なHMM
- カスタマイズ性を考慮した擬人化音声対話ソフトウェアツールキットの設計(音声言語情報処理とその応用)
- 隠れマルコフモデルを用いた旋律への自動和声付け
- 隠れマルコフモデルを用いた旋律への自動和声付け
- 擬人化音声対話エージェント基本ソフトウェアの開発プロジェクト報告(プロジェクト紹介(2))(第5回音声言語シンポジウム)
- 擬人化音声対話エージェント基本ソフトウェアの開発プロジェクト報告(第5回音声言語シンポジウム : プロジェクト紹介(2))
- 擬人化音声対話エージェント基本ソフトウェアの開発プロジェクト報告(第5回音声言語シンポジウム : プロジェクト紹介(2))
- 擬人化音声対話エージェントツールキットGalatea
- 擬人化音声対話エージェント開発プロジェクト
- 擬人化音声対話エージェントツールキットの基本設計
- 擬人化音声対話エージェントツールキットの基本設計
- F_0テンプレートbigramを用いた韻律句の係り受け構造推定に関する検討
- D-11-104 食品の凝固検査装置の開発(D-11.画像工学D(画像処理・計測),一般講演)
- 太陽光発電システムのPTCにおける評価事例報告
- 雑音下音声認識のための重み付け分散拡大に基づく単語HMMの耐雑音性の改善(音声,聴覚)
- 有声音検出に基づくロンバード音声認識と工場における検反システムへの応用
- 音声認識における単語HMMの重み付け分散拡大による耐雑音性の検討
- 単語HMMの重み付け分散拡大による雑音環境下音声認識
- XMLとCTIを利用した視覚障害者向けインターネットサービスシステム実証実験について (特集 新技術)
- 低域スペクトルの予測残差を利用した非定常高騒音環境での有声音区間の検出
- 低域スペクトルの予測残差を利用した騒音環境下の音声区間検出
- 大脳視覚野における情報処理に基づく階層型SOMのパターン分類能力
- 大脳視覚野におけるV1野-IT野を模した階層型SOMのパターン分類能力(モデル化応用)
- 隠れマルコフモデルによる音楽演奏からの音符列の推定
- 8パズルの高速解法
- 視覚障害者を対象としたストロークHMMオンライン文字認識方式の性能評価
- ガンマチャープフィルタバンクの構築
- SP2000-15 ヤコビ行列を用いた雑音環境への適応法の拡張
- ニューラルネットワークを用いたインド文字の特徴抽出について
- HMMと音符n-gramを用いた音楽リズム認識
- ヤコビ適応法を用いた雑音環境・伝達特性・話者への同時適応
- 重回帰HMMを用いた不特定話者音声認識
- ストロークHMMを用いたオンライン非目視手書き文字認識の性能評価
- 連続量を変形要因とする重回帰モデルを内包するHMM
- 連続量を変形要因とする重回帰モデルを内包するHMM
- 連続量を変形要因とする重回帰モデルを内包するHMM
- 非線形時間伸縮を用いたSupport Vector Machineによる時系列パタンの認識
- Support Vector Machineによる時系列パターンの認識
- Support Vector Machinesによる複数カテゴリの識別
- D-12-22 非接触三次元測定における視方向決定法(D-12.パターン認識・メディア理解,一般セッション)
- 視覚障害者用パーソナルOCRシステムの設計(バリアフリーインタフェース)
- 実時間意思決定システムに関する一提案
- 相互作用モデルに基づいたHI設計方法の検討
- F_0生成モデルを用いたテンプレートに基づく連続音声の句境界検出
- 韻律モデルを用いたF_Oクラスタリングに基づくアクセント句境界検出
- N^2-1パズルのスケールダウン解法(計算量理論とアルゴリズム論文小特集)
- 航空機パイロットの知識構造に関する一考察
- 実時間意思決定モデルの一提案とその応用
- F_0生成モデルに基づくピッチパターン整合を用いた雑音重畳単語音声の認識
- 矩形レイアウトモデルに基づく文書画像の領域識別 : 文書見出しの識別
- F_0生成過程モデルの指令探索によるピッチパターンの再構成法
- PRMU2000-36 ストロークHMMによるオンライン手書き文字認識の性能評価
- インタラクティブ性を重視した擬人化音声対話エージェントの基本設計 (テーマ なぜインタラクションでなければならないか?)
- 2000-SLP-32-13 音声対話システムにおける擬人化エージェントの挙動の数理的モデル