ロバストな音声認識実現を目的とした変調スペクトル特性の検討
スポンサーリンク
概要
- 論文の詳細を見る
CMS法や動的特徴は変調周波数特性を操作することにより音声認識性能が向上することが知られているが、どの変調周波数がどの程度重要であるのかという定量的な検討は行われていない。そこで本研究では、様々な変調周波数特性を持った入力に対し、音声認識性能の違いを種々の雑音環境、認識方式、特徴量のもとで調べた。その結果、以下のことが分かった: 1) 言語情報のほとんどが1〜16Hzの変調周波数帯域に存在し、その中でも4Hz付近が最も重要である。2) 変調スペクトルにおいては位相情報も重要である。 3) 4Hz付近の変調周波数を含む特徴量を用いることで動的特徴量と同等以上の結果が得られる。4) 適切な中心周波数と帯域幅をもつ複数のサブバンドを変調周波数上で用いることにより、認識性能がさらに向上する。
- 一般社団法人情報処理学会の論文
- 1997-12-11
著者
-
荒井 隆行
International Computer Science Institute
-
金寺 登
石川高専
-
船田 哲男
金沢大学 工学部 情報システム工学科
-
船田 哲男
金沢大
-
船田 哲男
金沢大・工
-
Hermansky Hynek
Oregon Graduate Institute of Science & Technology
-
Hermansky Hynek
Oregon Graduate Institute Of Science & Technology Portland
-
船田 哲男
金沢大学
関連論文
- 電磁オシログラフ(音の博物館)
- 雑音・残響下における科学技術英語の学習教材の開発(音声・言語・音響教育,一般)
- 小特集「誌上ビギナーズセミナー」にあたって(誌上ビギナーズセミナー)
- 雑音・残響下における発話の音響的特徴の話者変動(言語獲得・学習,合成,生成,韻律,一般)
- 波動音響シミュレータによる指向性の精度検証
- 日立シビックセンター科学館(音の博物館)
- 日本語母語話者成人と発達性構音障害児の摩擦音知覚における音響的手がかり(聴覚・音声・言語とその障害,一般)
- s/の口蓋化構音の音響的及び聴覚的キューに関する研究
- 音バリアフリーの現状と課題
- 音韻・韻律情報を用いた両耳融合聴課題に関する検討(言語獲得・学習,合成,生成,韻律,一般)
- FTTSSに基づいた音声認識LSIの開発(FPGAとその応用及び一般)
- FTTSSに基づいた音声認識LSIの開発
- FTTSSに基づいた音声認識LSIの開発(FPGAとその応用及び一般)
- FTTSSに基づいた音声認識LSIの開発(FPGAとその応用及び一般)
- FTTSSに基づいた音声認識LSIの開発(FPGAとその応用及び一般)
- 連載企画「音の博物館」を終えるにあたって(音の博物館)
- 母音のエネルギー定常部抑圧による高齢者に対する音節強調の検討
- 意欲喚起と自学自習支援による情報システムクリエータの育成
- 変調スペクトルの貢献度に基づく連続音声認識(国際ワークショップ:Speech dynamics by Ear, Eye, Mouth and Machine)
- 定常部抑圧処理による残響環境下の音声強調(ANC・エコーキャンセラー・ノイズキャンセラー/一般)
- 雑音下音声認識のための重み付け分散拡大に基づく単語HMMの耐雑音性の改善(音声,聴覚)
- 有声音検出に基づくロンバード音声認識と工場における検反システムへの応用
- 四次元MRIによる発音時の鼻咽腔閉鎖運動の観察 : 鼻咽腔閉鎖パターンと口蓋帆挙筋の動きとの関連の検討(第8回音声言語シンポジウム)
- 四次元MRIによる発音時の鼻咽腔閉鎖運動の観察 : 鼻咽腔閉鎖パターンと口蓋帆挙筋の動きとの関連の検討(Session-4 一般(ポスターセッション),第8回音声言語シンポジウム)
- 四次元MRIによる発音時の鼻咽腔閉鎖運動の観察 : 鼻咽腔閉鎖パターンと口蓋帆挙筋の動きとの関連の検討(Session-4 一般(ポスターセッション),第8回音声言語シンポジウム)
- 1.音声処理と音響信号のあゆみ(音声音響処理が開くマルチメディア)
- 小特集「音支援(音バリアフリー)を考える」にあたって
- 言語聴覚士のための音響教育 : 基礎から実用へ(現代のニーズに即した魅力ある音響教育)
- 変調スペクトルの貢献度に基づく連続音声認識
- ノイズの変調 Wavelet を用いた音声認識特徴量の選択的利用
- 変調スペクトルの貢献度に基づく音声認識特徴量
- 変調処理による自動音声認識のための頑強な特徴量抽出法 - 変調複素Wavelet変換を用いて -
- 自動音声認識の特徴量抽出への変調Wavelet変換の応用
- 学習達成度試験による専門教育の質の保証
- 複数の変調スペクトル解像度を用いた音声認識の耐雑音性
- 画像の解像度変換法に関する一考察
- 音声対話による飲食店案内システムの構築
- 汎用ディジタル信号処理プログラムの開発
- 適応フィルタのサブバンド処理を可能とする評価関数の提案
- 確率的な韻律規則を文脈自由文法に組み込んだ連続音声認識
- 音声コミュニケーションに関わるバリアフリー(音支援(音バリアフリー)を考える)
- 話者情報を担う変調周波数帯の調査 -雑音駆動音声を用いた話者識別知覚実験-
- 音声中の話者情報を担う変調周波数帯の調査
- 発話の困難な障害者のための声質変換・HMM音声合成を用いた日英音声合成システムの構築(音声合成・分析)
- 発話の困難な障害者のための声質変換・HMM音声合成を用いた日英音声合成システムの構築(音声合成・分析)
- G-006 動的計画法を用いた音声による講義ビデオシーン自動分割(G.音声・音楽)
- 独立成分分析を用いた音声による講義ビデオシーン分割
- 日本語と英語の発話音声に対する時間特性の比較分析
- 日本人ALS患者のための日英バイリンガル音声合成システムの構築
- 日本人ALS患者のための日英バイリンガル音声合成システムの構築
- 石川高専ネットワ-クの現状と課題
- 聴覚フィルタの広がりの補償を目的とした臨界帯域圧縮処理の模擬難聴環境下での評価(聴覚・音声・言語とその障害,一般)
- 軟らかい素材による軟口蓋を伴う声道の物理模型(ポスターセッション,第10回音声言語シンポジウム)
- 軟らかい素材による軟口蓋を伴う声道の物理模型(ポスターセッション,第10回音声言語シンポジウム)
- 軟らかい素材による軟口蓋を伴う声道の物理模型(ポスターセッション,第10回音声言語シンポジウム)
- 人にやさしい音声の話題
- 浜松科学館(音の博物館)
- 「音声によるバリアフリー」に向けた、公共空間で高齢者が聞き取りやすい拡声音情報の調査
- 単音節による雑音下の個人性知覚
- BPFPとNNを用いた雑音環境下でのピッチ抽出性能の評価
- SP2000-30 ピッチ乱れ, 雑音を付加したときのBPFP-NNピッチ抽出法の性能
- BPFPとNNを用いたピッチ周期性検出法の優位性の検討
- 変調スペクトルの重要な成分のみを選択的に用いた雑音に強い音声認識
- 雑音・残響環境下の拡声音声に適した発話に関する検討 (音声)
- 声門で発生する乱流音源に与える仮声帯の影響(音声・聴覚,一般)
- Q&Aコーナー(コーヒーブレーク)
- デ-タベ-ス検索のための音声対話システムの構築
- 音声による講義ビデオシーン分割方法の検討
- システム管理者にも情報が漏洩しない情報管理システムの構築
- D-14-17 雑音に強い単語音声認識特徴量
- B-4-39 公共空間における電磁波環境計測と評価 : 中波送信アンテナ近傍の公園の場合
- PIC演習システムの開発
- ニューラルネットを用いた音声の音韻セグメンテーション
- KNT法によるニュ-ラルネットワ-クの学習とベクトル量子化への応用
- エルゴディック隠れマルコフモデルを用いた単語境界の抽出
- エルゴディック離散/連続HMMを用いた単語境界の抽出
- 国際交流委員長挨拶(新会長および新委員長の就任挨拶)
- 雑音・残響環境下の拡声音声に適した発話に関する検討(音声・言語・音響教育,一般)
- 日本語における変調スペクトルとリズムの単位(リズムとタイミング)
- 音響管を用いた音響学・音声科学の教育(音声・言語・音響教育,一般)
- 小中学生に対する音響教育(現代のニーズに即した魅力ある音響教育)
- 小特集「現代のニーズに即した魅力ある音響教育」にあたって
- 声道模型(音の博物館)
- C7. 強さ曲線と変調スペクトルの日本語音節との関係(研究発表,日本音声学会創立80周年記念式典・第20回全国大会発表要旨)
- 声道模型を用いた音響教育--音声生成のしくみ
- 実環境下単語音声区間検出のための雑音EHMM再学習の効果
- 実環境下単語音声区間検出のための雑音EHMM再学習の効果
- SP2000-34 音声の変調スペクトル中に含まれる情報の調査 : 音声認識情報と話者識別情報との比較
- 連続音声認識に適した構文意味解析について
- 小特集「子どもの音声」にあたって(子どもの音声)
- 音声中の言語情報を担う変調スペクトル特性の検討
- ロバストな音声認識実現を目的とした変調スペクトル特性の検討
- ロバストな音声認識実現を目的とした変調スペクトル特性の検討
- ロバストな音声認識実現を目的とした変調スペクトル特性の検討
- B3-2. 語頭の無声摩擦音・破擦音識別におけるcue trading : 摩擦部の持続時間と振幅に着目して(研究発表,音声学会2011年度(第25回)全国大会発表要旨)
- 異音は音素より知覚しにくいのか : 英語話者が英語閉鎖音を知覚した場合(口頭発表,第323回研究例会発表要旨)
- 高齢者における聴覚特性の劣化が無声摩擦音・破擦音の識別に及ぼす影響
- 頑強な音声認識のための環境適応係数の識別誤り最小化学習
- 連続音声認識ニューラルネットの後処理
- ニューラルネットによる連続音声認識