音声スペクトルからの識別的特徴抽出に関する実験的検討
スポンサーリンク
概要
- 論文の詳細を見る
音声認識性能向上のための特徴抽出に関して実験的に検討した結果について述べる。ここでは、次の2項目、1)音声パワースペクトル包絡の抽出法としてフィルタバンクの設計とピーク強調処理を行った結果、2)時間変化パターンを強調した動的特徴の抽出法の効果、について検討を加えた。それぞれ現在、標準的に使用されている方法をベースラインとして単語認識実験の認識率で比較し、その改善を確認した。
- 社団法人電子情報通信学会の論文
- 1996-11-15
著者
関連論文
- 軽い音声認識システムの開発と課題(若手研究者育成レクチャーシリーズ,認識,理解,対話,一般)
- 三軸マイクロフォンアレイを用いた三次元ポインティング音声インタフェースの開発(福祉と音声処理,一般)
- 2群対判別法による不特定話者日本語単音節中の子音の識別
- 会議音声データの収録とデータファイル化
- ニュース音声コーパスの構築
- デコンボルーションによる声道形の推定と適応型音声分析システム
- 視覚情報を対話的に学習するマルチモーダル擬人化エージェント
- コンピュータとの対話におけるユーザの振舞いの解析
- 視覚・聴覚・発話機能を有するエージェント型マルチモーダルインタフェースの試作
- 調音の構造的制約を考慮した音声特徴抽出の検討
- 声帯振動の非線形効果パラメータのパタン化とその評価
- 声帯振動の非線形効果パラメータのパタン化
- ホルマントと調音パラメータノモグラムを用いた音声の低ビット符号化法
- 声帯振動の非線形効果を考慮した合成音声とその評価
- 共通中間音声符号系を用いた音声認識方式
- 声帯振動の非線形効果を考慮した音声合成法とその評価
- ホルマント・ノモグラムによる音声パラメータの調音解析の検討
- 声帯振動の非線形性を考慮した音声合成法とその評価実験
- 基本波フィルタリング法による精細ピッチパターンの抽出
- 音声文書検索のための多言語音素片セグメントの応用(第5回音声言語シンポジウム : ポスターセッション)
- 音声文書検索のための多言語音素片セグメントの応用(第5回音声言語シンポジウム : ポスターセッション)
- 音声認識技術とその応用,現状と課題
- 利得適応型AR-HMM分解法を用いた音響モデルの雑音適応化の検討(音響と音声処理,音声強調,ロバスト音声認識)
- 利得適応型AR-HMM分解法を用いた音響モデルの雑音適応化の検討(音響と音声処理,音声強調,ロバスト音声認識)
- 汎用音声符号系への符号化と音声処理システムの構築
- 言語に共通な音声符号系を用いた音声検索システム
- 人の表情を有し音声対話・視覚機能を備えたマルチモーダルインタフェース
- 座談会 : 音声研究 (音声研究)
- ARHMMに基づいた音声分析手法と歌声認識による評価(聴覚・音声及び一般)
- 対話型英語学習システムにおける日本人英語音声認識精度の検討
- 日本人英語の特性に基づく音声認識を用いた英会話学習支援システム
- 言語に共通な音声符号系とその音響セグメントモデルの作成
- 単語発声の複数サンプルを利用した未知語の音韻系列の推定(音声情報処理 : 現状と将来技術論文特集)
- 自動推論 Wizard of OZ システムによる日本語自由発話コーパス
- 被覆率を重視した大語彙連続音声認識用統計的言語モデル
- 人の間, ものの間のインタフェース
- WOZシステムで収録した自由発話音声の対話データベース
- 音声認識用統計的言語モデルのための形態素解析済みテキストの後処理
- ノンバーバル情報を導入した音声・画像統合対話システムでの初期データ収録
- ノンバーバル情報を導入した音声・画像統合対話システムの設計
- 複数サンプルを用いた未知語の音韻系列の推定
- 複数サンプルを用いた未知語認識
- RWC計画における音声対話データベースの構築
- 休止を単位とした漸進的対話処理
- 対話システム制御における時間の扱い
- EA2000-40 HMMによる音源のモデリングと高基本周波数に頑健な声道特性抽出法
- ユビキッキ : オフィス活動支援のための分散配置型ポータブルロボット(複合現実感,仮想都市,及び一般)
- 三軸マイクロフォンアレイを用いた三次元ポインティング音声インタフェースの開発(福祉と音声処理,一般)
- 音素上の文字列カーネルを用いた重度障害者の不明瞭音声コマンド認識(聴覚・音声・言語とその障害,一般)
- 音素上の文字列カーネルを用いた重度障害者の不明瞭音声コマンド認識
- HLAC尺度に依存した非定常信号処理 : 音素識別の性能評価(一般)
- 音素片と文字列カーネルを用いた語彙制約のないトピック分割について
- 音素片のカーネル主成分分析を用いたトピックセグメンテーション(セッション : 一般(知識処理), 「社会システムにおける知能」及び一般)
- 音素片のカーネル主成分分析を用いたトピックセグメンテーション
- 音素片のカーネル主成分分析を用いたトピックセグメンテーション(一般(知識処理), 「社会システムにおける知能」及び一般)
- マン・マシン対話データのピッチパターン分類に関する検討
- 単語アクセントパターン識別におけるモーラ単位HMMの語彙独立性の評価と検討
- セグメント単位の音声符号列からのレキシコンの生成
- 区分線形セグメントラティスによる日英混合音声の認識
- 言語混合単語音声認識に関する実験的検討
- 区分線形セグメントラティスにおける音韻的チャンクの抽出
- 中間符号系と記号列間距離計算に基づく音声処理の提案
- 区分線形セグメントラティス音韻モデルにおけるクラスタリング
- 単語セットの音声認識難易度推定 : 記号領域における単語間距離計算の応用
- 記号領域における単語間距離の計算と音声認識難易度
- 音声・視覚・画像をもつインタラクションシステム
- 区分線形セグメント列からの音素的構造の抽出
- 音声スペクトルからの識別的特徴抽出に関する実験的検討
- 音韻モデル獲得のための区分線形セグメントラティスの学習
- 時間の扱いを考慮した対話システム制御手法
- 区分線形セグメントラティスを用いた単語モデルの自動生成
- マンマシン対話における言語表現の多様性の解析
- MF143 表情筋および頸部の筋電位信号を利用した日本語母音の識別(MF14 情報・コミュニケーション支援,あたり前のことを知る)
- サポートベクターマシンを用いた筋電位信号からの日本語母音の識別(一般)
- 頸部から計測した筋電位信号を利用した発話認識
- 電総研の研究用音声データベース (<小特集>出揃った音声データベース)
- 休止を区切りとした対話処理
- 音声対話システム構築のための実対話データ収録実験
- 高度対話システムの実現のためのヒューマンファクタの解析
- 「話せばわかる」は「あたり前」?("あたり前"について考えたこと-福祉工学シンポジウム2007実行委員寄稿集-,あたり前のことを知る)
- 「音声研究者電子メールアドレス帳」について
- 音声の音響音声的変動パターンの類型化 : データベースと生成領域からの類推の利用 : 視聴覚技術 : 聴覚、音声関係および一般
- 音声の変動記述のための知識ベースについて
- 音声の音素片ネットワーク表現と時系列のセグメント化法を用いた自動ラベリング手法
- 単語音声サンプルからの音韻概念の獲得
- 対判別による多群パタ-ンの認識
- 認知症者とロボットの対話のための相槌認識における話者依存性の分析と話者適応の効果について(オーガナイズドセッション「人にやさしい音声情報処理」,福祉と音声処理,一般)
- 認知症者とロボットの対話のための相槌認識における話者依存性の分析と話者適応の効果について(オーガナイズドセッション「人にやさしい音声情報処理」,福祉と音声処理,一般)
- 軽度認知症高齢者のための情報支援システムにおける不適格発話に頑健な談話行為識別 (一般セッションと「ワークショップにおける学びの共有化」に関する特別セッション)