雑音環境の変動を考慮した話者適応化
スポンサーリンク
概要
- 論文の詳細を見る
本報告では、教師なし逐次話者適応化方式を提案する。教師なし逐次話者適応化の実場面での利用においては、適応化時の環境の変化により適応化性能が低下することが問題となる。この問題に対処するため、高速環境適応(REALISE法)を用い発声毎に環境の変動の影響を除去し、この環境の影響を除去した後の音声に対して木構造確率分布を用いた自律的話者適応化を行なうQ評価は、環境が変化する場合を想定し、6名が発声した3種類の走行条件の自動車内音声を1単語毎に交互に提示して行なった。その結果、適応化なしで79%の認識率であったものが、REALISE法のみで90%、提案するREALISE法と木構造適応化の併用により100単語適応時に95%となり、方式の有効性を確認した。
- 社団法人電子情報通信学会の論文
- 1995-12-15
著者
-
篠田 浩一
Necマルチメディア研究所
-
渡辺 隆夫
日本電気(株)中央研究所
-
服部 浩明
Nec メディア情報研究所
-
服部 浩明
NEC情報メディア研究所
-
渡辺 隆夫
NEC情報メディア研究所
-
篠田 浩一
NEC情報通信メディア研究本部
-
高木 啓三郎
Nec 情報メディア研究所
-
高木 啓三部
NEC情報メディア研究所
-
篠田 浩一
Nec情報メディア研究所
関連論文
- シンボル列化したシーンの学習と2種のプレイ種相関度による野球放送映像プレイ種識別(画像・映像処理)
- SIFT混合ガウス分布と音響特徴を用いた映像からの高次特徴検出(テーマセッション関連,一般物体認識・画像特徴量)
- CHLAC特徴と隠れマルコフモデルを用いたGait認識(一般セッション2,複合現実感のためのパターン認識・理解)
- 統計的モデル選択によるシーン数の自動推定を用いた動画要約(一般セッション3,複合現実感のためのパターン認識・理解)
- 耐雑音音声認識のためのハフ変換による基本周波数情報抽出の高速化
- 音声とペン入力の同時入力に対する認識方式の検討(認識・理解・対話・一般)
- C&Cの夢,自動通訳の実現に向けて : 受賞業績 携帯端末など組込み機器向け多言語自動音声翻訳システムの実用化技術の開発(平成20年度喜安記念業績賞紹介)
- 数値列化したイベントシーンの学習と試合進行状況情報による制約条件を用いた野球映像イベント識別(パターン認識・メディア理解のための学習理論とその周辺)
- 基本周波数情報を用いたダイナミックベイジアンネットワークによる音声認識(聴覚・音声・言語とその障害,一般)
- 音声と手書き文字の同時入力インターフェース(マルチモーダル, コーパス・言語モデル)
- 弁別素性のグラフィカルモデリングによる音声認識
- 十分統計量を用いた教師なし話者適応における話者選択法(一般(ポスターセッション),第9回音声言語シンポジウム)
- 局所的な特徴と大局的な特徴を用いた監視カメラ映像からの行動イベント検出(一般,First Person Visionのための認識・理解)
- 携帯端末向け大語彙連続音声認識システム(音声,聴覚)
- 音声による文章入力のための言語モデル適用法の検討
- PDAで動作する旅行会話向け日英双方向音声翻訳システム
- ビームサーチを用いた大語彙音声認識方式の検討
- LE-1 自由文通訳と例文選択型通訳を統合した自動通訳システム(E. 自然言語・文書)
- 音響モデル学習のための相対エントロピーを用いた学習文選択
- PDAで動作する旅行会話向け日英双方向音声翻訳システム
- 自動通訳システムINTERTALKERにおける日本語音声合成
- 音声と手書き文字の同時入力インターフェース(マルチモーダル, コーパス・言語モデル)
- AS-1-3 低消費電力マルチコアプロセッサで動作する大語彙連続音声認識とその応用(AS-1.マルチコアプロセッサ技術,シンポジウム)
- 十分統計量を用いた教師なし話者適応における話者選択法(一般(ポスターセッション),第9回音声言語シンポジウム)
- 十分統計量を用いた教師なし話者適応における話者選択法(一般(ポスターセッション),第9回音声言語シンポジウム)
- 音声認識における確率モデルの重み係数の自動推定(音声認識・識別,第9回音声言語シンポジウム)
- 音声認識における確率モデルの重み係数の自動推定(音声認識・識別,第9回音声言語シンポジウム)
- 音声認識における確率モデルの重み係数の自動推定(音声認識・識別,第9回音声言語シンポジウム)
- 音声認識のための高速最ゆう推定を用いた音道長正規化(音声情報処理 : 現状と将来技術論文特集)
- 音声認識のための高速最ゆう推定を用いた声道長正規化
- 音声認識のための高速最ゆう推定を用いた声道長正規化
- 音声認識のための高速最ゆう推定を用いた声道長正規化
- 局所的な特徴と大局的な特徴を用いた監視カメラ映像からの行動イベント検出(一般,First Person Visionのための認識・理解)
- 局所的な特徴と大局的な特徴を用いた監視カメラ映像からの行動イベント検出(一般,First Person Visionのための認識・理解)
- 木構造クラスタリングを用いた動画像からの高次特徴抽出(一般セッション1,文字・文書の認識・理解)
- SIFT混合ガウス分布を用いた一般物体認識のためのマルチカーネル学習(テーマセッション,コンピュータビジョンとパターン認識のための機械学習と最適化,一般)
- SIFT混合ガウス分布を用いた一般物体認識のためのマルチカーネル学習(テーマセッション,コンピュータビジョンとパターン認識のための機械学習と最適化,一般)
- パソコン向け音声認識合成プラットフォームの構築とアプリケーションの試作
- 概念表現を用いた自動通訳システムINTERTALKER
- 投球の次ショットに重きを置いたシーンのパターン化と離散隠れマルコフモデルを用いた野球放送映像の自動イベント分類
- 隠れマルコフモデルを用いた野球放送の自動的インデクシング(顔・ジェスチャ認識のためのパターン認識メディア理解,一般)
- 隠れマルコフモデルを用いた野球放送の自動的インデクシング(顔・ジェスチャ認識のためのパターン認識メディア理解,一般)
- 会議音声認識のためのスペクトル減算に基づくオンライン音源分離(オーガナイズドセッション:スピーチエンハンスメント,音声,応用/電気音響,信号処理,及び一般)
- 会議音声認識のためのスペクトル減算に基づくオンライン音源分離(オーガナイズドセッション:スピーチエンハンスメント,音声,応用/電気音響,信号処理,及び一般)
- 音声認識のためのスペクトルの調波構造の利用
- SNRの変動を考慮したスペクトルサブトラクションの検討
- 種々の電話機による音声認識性能の評価
- 環境変動を考慮した電話音声認識方式の種々の電話機による評価
- 雑音環境を考慮した自律型話者適応化
- 雑音環境の変動を考慮した話者適応化
- 音声認識のための高速環境適応
- 高速環境適応におけるコンパクト化の検討
- 雑音環境の変動に強い音声認識 (音声/オ-ディオ信号処理) -- (音声認識)
- 音声認識のための高速環境適応
- パソコン向け音声認識ソフトウェア
- 自動通訳システムINTERTALKERにおける音声認識
- 話し言葉認識に向けた基本技術と応用(抽出と解析)
- 話し言葉認識に向けた基本技術と応用(抽出と解析)
- 音声認識のための複数の認識器を利用した能動学習(音響モデル,第11回音声言語シンポジウム)
- 音声認識のための複数の認識器を利用した能動学習
- 講義音声認識における講義スライド情報の利用(第8回音声言語シンポジウム)
- 話者照合における連続音節認識による登録パターン作成方法
- 認識対象語彙の音素環境を考慮した半音節を用いた音声認識
- 音素環境を考慮した半音節を単位とする音声認識方式の検討
- 半音節単位に基づく単語認識のためのワードスポッティング
- 半音節を用いたワードスポッティングによる単語認識
- バンドルサーチ法を用いた連続音声認識の高速化
- 日英双方向自動通訳システムINTERTALKER
- 自動通訳システム (音声ヒューマンインタフェース特集)
- 連続音声認識からの概念表現の作成
- MDL基準を用いたHMMサイズの削減
- 音声認識のためのMDL基準を用いた効果的なガウス数削減
- 音声認識のためのMDL基準を用いた効果的なガウス数削減
- 音声認識における自律的なモデル複雑度制御を用いた話者適応化(論文賞贈呈)
- 音声認識における自律的なモデル複雑度制御を用いた話者適応化
- 情報量基準を用いた音声認識単位の自動生成
- 記述長最小原理を用いた話者適応化
- パソコン向けソフトウェア連続音声認識システム
- パソコンソフト連続音声認識
- 木構造化された確率分布を用いた話者適応化
- 大語彙音声入力装置の開発
- 音声認識のためのスペクトル内挿を用いた話者適応化
- 話し言葉認識技術とその応用 (ユビキタス環境を活用し,企業競争力を向上させる「UNIVERGE」特集) -- (ソリューション)
- 半音節を単位とするHMMを用いた不特定話者音声認識
- 講義音声認識における講義スライド情報の利用(Session-6 音声認識,第8回音声言語シンポジウム)
- ハイブリッドモデルに基づく単視点ビデオデータにおける人間の歩行動作のトラッキング
- ハイブリッドモデルに基づく単視点ビデオデータにおける人間の歩行動作のトラッキング (コンシューマエレクトロニクス・メディア工学)
- 講義音声認識における講義スライド情報の利用(Session-6 音声認識,第8回音声言語シンポジウム)
- 講義音声認識における講義スライド情報の利用
- 音声入力パソコンネットワーク旅客機空席案内試作システム
- 音声インタフェースを用いたパソコンネットフライト空席案内
- 音声認識におけるパタンマッチングの手法
- D-14-5 コンパクトな音声合成用テキスト解析エンジンの開発
- 決定木を利用した代表ピッチパタンの自動獲得
- 音声合成 (音声ヒューマンインタフェース特集)
- 情報量基準を用いた状態クラスタリングによる音響モデルの作成
- 情報量基準を用いた状態クラスタリングによる音響モデルの作成
- 雑音下音声におけるスペクトル縮小の分析とその耐雑音音声認識への利用
- 音声入力を用いたパソコンネット旅客機空席案内システム
- パソコン音声認識ソフトウエアを用いた音声ダイヤラの試作