競合MAP推定法を用いた話者・環境適応学習
スポンサーリンク
概要
- 論文の詳細を見る
音声認識における話者適応学習において広く適用されている最大事後確率推定法(Maximum A Posteriori probability estimation : MAP推定法)に競合学習の考えを導入した競合MAP推定法(Competitive MAP estimation : CMAP推定法)を提案する.本法では,正解音素系列のビタビセグメンテーション結果と,最大ゆう度を示す最ゆう音素系列のビタビセグメンテーション結果との差異を利用し,正解音素に対する正の学習のみならず,誤り音素に対する負の学習を行うことで,MAP推定法のもつクラス内学習の効果に加えて,クラス間学習も同時に実現することを可能とした.クリーンな環境での話者適応実験では,50単語の適応データで,従来のMAP推定法に比べて25%の誤り改善効果があった.また,雑音環境下での話者と環境の同時適応実験では,SN12dBで37%の誤り改善効果を示し,本方法の有効性が確認された.
- 社団法人電子情報通信学会の論文
- 2003-03-01
著者
-
河村 聡典
(株)東芝研究開発センター
-
竹林 洋一
(株)東芝研究開発センター
-
竹林 洋一
静岡大学情報学部情報科学科
-
竹林 洋一
静岡大学情報学部情報学科
-
金澤 博史
(株)東芝
-
金沢 博史
(株)東芝関西研究所
-
金澤 博史
(株)東芝研究開発センター 川崎市
-
金沢 博史
(株)東芝 関西研究所
-
河村 聡典
(株)東芝 研究開発センター 知識メディアラボラトリー
関連論文
- 音声認識実用化技術の展開(総合報告)
- 音声行動コーパスに基づく模倣場面に着目した音声言語獲得過程分析(言語獲得・学習,合成,生成,韻律,一般)
- 7.Bluetoothなどのローカルネットワーク技術(モバイル社会を支える先端技術 : 小型化と使いやすさを極める)
- ユビキタスセンシングによる格闘技の身体および心的モデルの検討(サービス・サービスイメージ)
- 音素HMMを環境適応的に選択して用いた競合モデルによる環境雑音のリジェクション
- NeXT Computerを用いた音声合成実験環境
- サイクリングを楽しむ視覚障碍者のためのBGM生成による速度感の演出(ヒューマンインタフェース基礎,インタラクションの理解とデザイン)
- 「人間の非論理情報を AIはどう取り扱うか」へのコメントと回答
- 2000-HI-89-6 Bluetoothの開発動向とヒューマンインタフェースへの応用
- キーボード対話からの感情抽出に関する検討
- 計算機との対話のための非言語音声の認識と合成
- 音声自由対話システムTOSBURG II : ユーザ中心のマルチモーダルインタフェースの実現に向けて
- 9 音声認識の多言語化技術(音声認識技術の実用化への取り組み)
- 競合MAP推定法を用いた話者・環境適応学習
- 組織活性化支援のためのマルチモーダルナレッジの活用
- ユビキタス社会に向けた Bluetooth ヘッドセットの開発
- ユビキタス環境における音声対話システムMKIDSの開発
- Bluetoothのウェアラブルコンピューティングへの応用 (特集 新たなワイヤレスの世界を創るBluetoothの展開--ワイヤレスで簡単接続,パーソナルエリアネットワークの世界へ)
- 知識情報共有システム(Advice/Help on Demand)の開発と実践 : 知識ベースとノウハウベースの構築(次世代ヒューマンインタフェース・インタラクション)
- マルチモーダル秘書エージェントシステムの開発
- 知識ベースとノウハウベースの連携による知識情報共有システムの実現
- Advice/Help on Demand : 知識べースとノウハウベースの連携
- キーワードラティスのLR解析による自由発話理解
- コモンHIサービス環境の応用
- コモンHIサービス環境の開発
- コミュニケーション支援のための個人情報公開システムPIP
- 雑音免疫学習を用いたサブワードHMMに基づく雑音環境下の音声認識
- コミュニケーション支援のための個人情報公開システム(PIP) : 音声とキー入力を用いたマルチモーダル対話の検討
- 単語パターン照合と音韻HMMを併用したワードスポッティングに関する検討
- 音声自由対話システムにおける音声応答キャンセル機能の実現
- 音声自由対話システムTOSBURG IIにおけるデータ収集と評価
- 音声自由対話システムTOSBURG IIの評価
- 不特定話者音声自由対話システム TOSBURG2 : マルチモーダル応答と音声応答キャンセル利用
- 車載情報機器システムにおける情報流の視点からのマルチモーダルインタラクションの設計
- ソフトウェア音声認識インタフェースの検討
- 実時間音声対話システムTOSBURGの開発(1)システム構成
- 音声認識の多言語化技術 (特集 音声認識技術の実用化への取り組み)
- オンライン重ね書き文字認識--小型携帯機器に適した文字入力インタフェース (特集 デジタルメディア処理先端技術)
- 識別的特徴抽出に基づく音声区間検出の検討(Session-8 ポスターセッション: 一般, 第7回音声言語シンポジウム)
- 識別的特徴抽出に基づく音声区間検出の検討(Session-8 ポスターセッション: 一般, 第7回音声言語シンポジウム)
- 識別的特徴抽出に基づく音声区間検出の検討(Session-8 ポスターセッション: 一般, 第7回音声言語シンポジウム)
- 音節継続長比モデルを用いた音声認識の検討(ポスターセッション)(第6回音声言語シンポジウム)
- 音節継続長比モデルを用いた音声認識の検討(ポスターセッション)(第6回音声言語シンポジウム)
- 音節継続長比モデルを用いた音声認識の検討(ポスターセッション)(第6回音声言語シンポジウム)
- オンライン重ね書き文字入力インタフェースおよび認識方式
- オンライン重ね書き文字入力インタフェースおよび認識方式
- オンライン重ね書き文字入力インタフェースおよび認識方式
- ユビキタス情報環境下のコミュニケーション活性化システムの開発(ヒューマン情報処理及び一般)(ヒューマンコミュニケーショングループ(HCG)大会)
- マルチモーダル幼児行動分析による物を介したインタラクション行動モデルの構築
- マルチモーダル幼児行動分析による物を介したインタラクション行動モデルの構築(一般セッション,コミュニケーション支援,共生コミュニケーション及び一般)
- マルチモーダル幼児行動分析による物を介したインタラクション行動モデルの構築(一般セッション,コミュニケーション支援,共生コミュニケーション及び一般)
- マルチモーダル幼児行動分析による物を介したインタラクション行動モデルの構築(一般セッション,コミュニケーション支援,共生コミュニケーション及び一般)
- A-15-37 育児支援のための親子コミュニケーションコーパスのデザイン(A-15.ヒューマン情報処理,一般セッション)
- 2008E-G5-6 マルチモーダルセンシングによる船舶ブリッジ業務シミュレータの開発(一般講演(G5))
- 音声コミュニケーション研究のためのマルチモーダル音声行動コーパス(対話・インタフェース・インタラクション)
- 発話行動のマルチモーダル記述による幼児の発達過程観察(コミュニケーション・対話,第9回音声言語シンポジウム)
- 楽器演奏支援のためのウェアラブルインテリジェンスと音声対話(信号処理・符号化・一般)
- 楽器演奏支援のためのウェアラブルインテリジェンスと音声対話(信号処理・符号化・一般)
- 音声認識実用化技術の展開
- 家電連携フレームワークにおけるユニバーサルアクセスの試み
- 文書構造抽出技法の開発
- 2X-9 子供の社会的行動理解のための発達段階別行動シミュレータの検討(人工知能と社会,学生セッション,人工知能と認知科学,情報処理学会創立50周年記念)
- J-006 育児支援のための取り合い場面における幼児の社会的行動モデルの検討(ヒューマンコミュニケーション&インタラクション,一般論文)
- KL展開と一般化確率降下法によるセグメント量子化の高速化
- A-10-11 車外音を活用した快走支援音響コンテンツの作成(A-10.応用音響,一般講演)
- HIの高度化を目指したメディア変換機能統合利用環境の構築 : HIウエアの開発
- マルチモーダルインタフェースの技術動向
- 雑音下の連続音声中からのキーワード検出
- 実時間音声対話システムTOSBURGの開発(3)対話処理
- 実時間音声対話システムTOSBURGの開発(2)音声理解
- 高耐雑音音声認識用アクセラレータの開発
- Bluetoothが拓くモバイル・ウェアラブルの世界(モバイル・ウェアラブルインテリジェンス)
- 「人間支援のためのバウンダリーレスなAI研究に向けて」へのコメントと回答 : 回答
- 人間支援のためのバウンダリーレスなAI研究に向けて
- DJインターフェイスを利用した音響環境のデザイン(一般2)(「ユビキタスとセキュリティ」および一般)
- ユニバーサルアクセスを考慮した家電操作マニュアルの検討
- 快走支援のためのマルチモーダルインタフェースとサラウンド感覚の拡張(ホームネットワークと組込みシステム, マルチモーダルインタフェース, ホームネットワーク, ヒューマンインタフェース, 情報家電, アクセシビリティ)
- 快走支援のためのマルチモーダルインタフェースとサラウンド感覚の拡張
- マルチモーダルヘッドセットを用いたうなずき検出と会話の重要箇所把握(一般1)(「ユビキタスとセキュリティ」および一般)
- ユビキタス社会の画像応用から見たセンシング技術への期待 : マルチモーダル知識コンテンツで経済・社会を活性化
- 最小分類誤り学習による特徴選択型文字認識
- 最小分類誤り学習による特徴選択型文字認識
- 1. 総論 : 1-1 ヒューマンインタフェースの観点から見た気の利いた情報システム (気の利いた情報システム)
- ディジタルメディア時代のヒューマンインタフェース研究の魅力 (私の研究生活事始め)
- 実時間音声対話システムTOSBURGの開発(4)マルチモーダル応答
- 2.6 ゲームと進化および社会の数理理論的研究 : エンタテインメントコンピューティングの事例(エンタテインメントコンピューティング)
- ヒューマンインタフェースの進化 : 情報処理技術 : 過去十年そして今後の十年
- 変形文字を用いた認識辞書の作成
- 音声自由対話システムTOSBURG IIにおけるデータ収集と評価環境
- 音声自由対話システムにおける対話データ収集
- 特集「産学連携論文」・「社会人学生論文」の編集にあたって
- 特集「産学連携論文」・「社会人学生論文」の編集にあたって
- 双方向インターネット・ストリーミングを用いた遠隔地からのライブ出演を実現するコンサート支援システム
- K-033 映像情報の動的構造化とストリーミング配信に関する検討(K分野:ヒューマンコミュニケーション&インタラクション)
- 平成14年度情報学部研究プロジェクト報告 : 英語コミュニケーション環境活性化のためのインタラクション支援プロジェクト
- K-084 プレゼンテーション画面の手頃な手元配信方式の検討(K.ヒューマンコミュニケーション&インタラクション)
- K-081 能動的把握を補助する視覚補償機器(K.ヒューマンコミュニケーション&インタラクション)
- 「人間支援のためのバウンダリーレスなAI研究に向けて」へのコメントと回答
- EDR電子化辞書を用いた音声入力による知的文書作成支援システム
- 音声認識を用いたEDR電子化辞書の評価環境