音声認識に有効な周波数帯域についての研究
スポンサーリンク
概要
- 論文の詳細を見る
音声認識に用いるパラメータとして、メル、バークなとの聴覚心理尺度に周波数変換したパラメータが用いられることがある。しかし、聴覚特性に基づいていても、それが音声認識に対してかならずしも最適であるとはいえない。そこで、本研究では線形選択予測の手法を用い、音声認識に対して有効な周波数帯域の調査を行なうことを目的とする。まず、選択線形予測の計算において自己相関係数を直接変換するという手法を提案した。そして、その手法が従来の方法よりも計算量の点で有利になることを示した。次に、この手法を用いて求めたパラメータを用い、単語音声認識実験を行なった。その結果、バーク軸にワーピングしたパラメータは、認識率を周波数軸に対して均一化するという点でリーズナブルであることが確かめられた。
- 社団法人電子情報通信学会の論文
- 1994-09-06
著者
関連論文
- 音声言語関連大型プロジェクトの現状と将来
- パネル討論 : 音声言語関連大型プロジェクトの現状と将来
- 1985年IEEE音響・音声・信号処理国際会議(ICASSP85)
- 1983年IEEE音響・音声・信号処理国際会議 : ICASSP83
- 第91回米国音響学会及びIEEEの音響・音声・信号処理に関する1976年国際会議
- 音声スペクトルの統計的パラメ-タに含まれる個人性情報
- 長時間平均スペクトルによる話者認識における経時変化の効果
- 連続音声認識結果からの言語エントロピーの推定
- 空間音響特性を考慮したスぺースダイバーシチ型ロバスト音声認識(音声情報処理 : 現状と将来技術論文特集)
- 室内音響特性を考慮した音声認識に関する検討
- 空間音響特性依存HMMによるスペースダイバーシチ型ロバスト音声認識
- 空間音響特性依存HMMによるスペースダイバーシチ型ロバスト音声認識
- 端点検出を行わない連続音声認識
- 端点検出を行わない連続音声認識手法
- 端点検出を行わない連続音声認識手法
- 端点検出を行わない連続音声認識手法
- 音場再現におけるマルチチャネル信号の空間符号化
- 非線形恒等写像を利用した音声スペクトルの次元圧縮法とその音声認識への応用
- 砂時計型ニューラルネットによるLPCスペクトルの次元圧縮
- 砂時計型ニューラルネットによるLPCスペクトルの次元圧縮
- ニューラルネットワークによる音声スペクトルの次元圧縮
- 砂時計型ニューラルネットによる音声スペクトルの次元圧縮
- ユーザ評価と達成度との相関に基づく音声対話システムの品質評価の予備的検討(対話インタフェース)(第5回音声言語シンポジウム)
- ユーザ評価と達成度との相関に基づく音声対話システムの品質評価の予備的検討(第5回音声言語シンポジウム : 対話インタフェース)
- ユーザ評価と達成度との相関に基づく音声対話システムの品質評価の予備的検討(第5回音声言語シンポジウム : 対話インタフェース)
- 汎用音声認識エンジンJulius/JulianのPDAへの移植と性能評価
- 相互情報量最大化に基づくブラインドデコンボリューションの前処理
- 情報量最大化手法を用いたブラインドデコンボリューション
- 情報量最大化手法を用いたブラインドデコンボリューション
- 音声研究会報告 : 解説と展望
- 複素関数論とz変換(電子情報通信と数学)
- 音声の高域に含まれる個人性情報を用いた話者認識
- 雑音環境下における音声の発声変形の検討
- 音声生成逆問題における動的制約と音響的制約の結合
- 声道断面積の音響的測定 : システムモデリングと実験結果
- Ergodic HMMからの構造抽出における状態数削減に関する検討
- 音声認識に有効な周波数帯域についての検討 -複数帯域を用いた場合の検討-
- 線スペクトルパラメータの量子化の検討
- ergodic HMMからの構造抽出に関する検討
- 音声認識に有効な周波数帯域についての研究
- 音声の高域に含まれる情報を用いた話者認識 : Selective LPによる詳細な検討
- 木探索を用いたLSPパラメータの多段ベクトル量子化
- オーディオ変換符号化における変換係数のマルチ・コードブックを用いたVQ
- ヒューマンスピーチライク雑音の分析による音声特徴の抽出
- ヒューマンスピーチライク雑音における音声的特徴の分析
- 聴覚実験による音声と他の音の弁別に関する調査
- 笙の物理モデル合成法を用いた各種奏法の実現
- 笙の物理モデルの発振条件について
- 笙の物理モデルにおける制御パラメータの影響の検討
- 笙の物理モデリング
- 笙の物理モデリング
- 統計的手法による音声の分析・合成 : ML法からPARCORを経てLSPへ(フェロー賞受賞特別招待講演)
- 統計的手法による音声の分析・合成 : ML法からPARCORを経てLSPへ
- 統計的手法による音声の分析・合成 : ML法からPARCORを経てLSPへ(フェロー賞受賞特別招待講演)
- Q&Aコーナー
- 1.ケータイの昨今(ケータイの科学)
- 金原,淳先生を偲ぶ
- 長さごとに用意されたセグメント標準パターンとの照合に基づく音声認識
- 統計パラメータと標準パターンを併用する音声認識
- 不定長セグメントの連続照合に基づく音声認識
- 不定長セグメントの連続照合に基づく単語スポッティング
- 不定長セグメントの連続照合に基づく単語スポッティング
- 不定長セグメントの連続照合に基づく単語スポッティング
- 線形予測符号化と複合正弦波モデル化の対称性
- 音声言語関連大型プロジェクトの現状と将来
- 映像付き雑音環境下音声認識評価用共通データベースAURORA-2J-AV/AURORA-3J-AVの構築(一般セッション(4) : 福祉・医療のためのパターン認識・メディア理解)
- 映像付き雑音環境下音声認識評価用共通データベースAURORA-2J-AV/AURORA-3J-AVの構築(福祉・医療のためのパターン認識・メディア理解)
- 映像付き雑音環境下音声認識評価用共通データベースAURORA-2J-AV/AURORA-3J-AVの構築(福祉・医療のためのパターン認識・メディア理解)
- スペクトルサブトラクションとピッチ同期KLTの複数の雑音抑圧手法を組合せたAurora2データベースに対する音声認識性能の改善
- スペクトルサブトラクションとピッチ同期KLTの複数の雑音抑圧手法を組合せたAurora2データベースに対する音声認識性能の改善
- スペクトルサブトラクションとピッチ同期KLTの複数の雑音抑圧手法を組合せたAurora2データベースに対する音声認識性能の改善
- 室内伝達関数の時間変動特性
- 複数モデルを選択的に用いる音声対話システムにおけるドメイン切り替え尺度の検討
- 音声対話システムを用いた車内対話の収集
- 帯域別ダイナミックレンジによる音声認識率の予測
- 複数の発声様式を用いた話者モデルの学習法の検討
- 発声様式毎の話者特徴の多次元尺度解析
- 話者識別システムの発声様式の変動に対する頑健性について
- 対数スペクトルの重回帰に基づく分散マイクロホン出力の統合(音響と音声処理,音声強調,ロバスト音声認識)
- 対数スペクトルの重回帰に基づく分散マイクロホン出力の統合(音響と音声処理,音声強調,ロバスト音声認識)
- 周波数帯域分割を利用した室内伝達関数の極零モデル化
- 大規模車内音声データベースにおける認識性能変動要因調査(耐雑音)(第5回音声言語シンポジウム)
- 大規模車内音声データベースにおける認識性能変動要因調査(第5回音声言語シンポジウム : 耐雑音)
- 大規模車内音声データベースにおける認識性能変動要因調査(第5回音声言語シンポジウム : 耐雑音)
- 走行車室内音声対話収録システムの開発
- 実走行車内における音声データベース(音声処理技術のデモの紹介)
- 実走行車内における音声データベースの構築
- スパーク音源を用いた頭部伝達関数の測定
- 水平方向及び仰角方向に関する頭部伝達関数の補間
- 加法的付加雑音に対するSBCORスペクトルの性能評価
- CF^の整数倍での自己相関係数を考慮したSBCORスペクトル
- 名古屋大学 統合音響情報研究拠点CIAIR
- 音声スペクトルの統計的最適識別法
- 直交櫛形フィルタを用いた音声中の雑音抑圧
- 音声の線形予測分析
- 音声の線形予測分析
- 室内環境の変化による残響系変動に関する検討
- 残響系伝達関数の時間変動への適応
- 低ビットレート音声符号化のための背景雑音信号のモデル化に関する検討
- SD-2-3 低ビットレート音声符号化のための背景雑音信号のモデル化に関する検討