最小分類誤り学習による特徴選択型文字認識

概要

論文の詳細を見る
従来より主成分分析, 正準判別分析等の特徴選択により認識性能の低下を防ぎつつ認識計算コストを下げる方法が知られているが, その計算コスト削減量にはまだ不満足なものがある. 本報告では, 特徴選択後の認識部に, 最小分類誤り学習を適用することにより, 認識性能の低下を極力押さえつつ認識計算コストを大幅に削減できることを示す. また, 更に特徴選択部をも最小分類誤り学習の対象とすることにより, より高精度, 低コストの識別系の構築が可能であることを示す.
社団法人電子情報通信学会の論文
1997-01-24

著者

河村聡典
(株)東芝研究開発センター
新田恒雄
豊橋技術科学大学大学院工学研究科
河村聡典
(株)東芝マルチメディア技術研究所
新田恒雄
(株)東芝マルチメディア技術研究所
河村聡典
(株)東芝研究開発センター知識メディアラボラトリー

関連論文

音声認識実用化技術の展開(総合報告)
スライド共有による質疑応答機能を組み込んだ講義システムの開発(e-Learningコンテンツ/一般)
Suffix Arrayを用いた音声文書の高速検索
音素HMMを環境適応的に選択して用いた競合モデルによる環境雑音のリジェクション
9 音声認識の多言語化技術(音声認識技術の実用化への取り組み)
競合MAP推定法を用いた話者・環境適応学習
音声認識の多言語化技術 (特集音声認識技術の実用化への取り組み)
調音運動HMM音声合成における調音特徴--声道パラメータ変換と音源の改良 (音声)
調音運動HMM音声合成における調音特徴--声道パラメータ変換と音源の改良 (言語理解とコミュニケーション)
パソコン用音声認識ソフトウェアの応用
音声認識/合成OCXの開発
予備選択とA^*探索による大語彙単語認識
単語スポッティングに適した語頭・語尾モデルの検討
東芝における最近の音声合成・認識の応用
SBusカードを用いたWSベース大語彙音声認識システム
環境騒音の違いが音声認識に与える影響
調音運動HMM音声合成における調音特徴-声道パラメータ変換と音源の改良
オンライン重ね書き文字認識--小型携帯機器に適した文字入力インタフェース (特集デジタルメディア処理先端技術)
識別的特徴抽出に基づく音声区間検出の検討(Session-8 ポスターセッション: 一般, 第7回音声言語シンポジウム)
識別的特徴抽出に基づく音声区間検出の検討(Session-8 ポスターセッション: 一般, 第7回音声言語シンポジウム)
識別的特徴抽出に基づく音声区間検出の検討(Session-8 ポスターセッション: 一般, 第7回音声言語シンポジウム)
音節継続長比モデルを用いた音声認識の検討(ポスターセッション)(第6回音声言語シンポジウム)
音節継続長比モデルを用いた音声認識の検討(ポスターセッション)(第6回音声言語シンポジウム)
音節継続長比モデルを用いた音声認識の検討(ポスターセッション)(第6回音声言語シンポジウム)
オンライン重ね書き文字入力インタフェースおよび認識方式
オンライン重ね書き文字入力インタフェースおよび認識方式
オンライン重ね書き文字入力インタフェースおよび認識方式
東芝の音声認識・合成ソフトウエアの紹介
パソコン用文音声合成ソフトウェアエンジンの開発
3ステージMLNと抑制/強調処理に基づく調音特徴抽出(ポスターセッション,第10回音声言語シンポジウム)
音声処理モジュールのプログラミングインタフェースとアプリケーション開発環境
音声合成/認識APIと応用ソフト開発環境の動向
音声セグメントベース規則合成方式を用いた英単語音声合成LSIの開発
直交化残差方式による文音声合成の検討
音声認識実用化技術の展開
複合音響特徴平面に基づく音声認識のための局所特徴抽出法(音声情報処理 : 現状と将来技術論文特集)
マルチモーダルUIにおけるモダリティ制御統一のためのモデル化手法 (音声言語情報処理)
ラピッドプロトタイピングツールMuseのCASEへの適用(マルチモーダルIF (3),「マルチモーダルと音声HI」およびヒューマンインタフェース/音声言語情報処理一般)
ラピッドプロトタイピングツールMuseのCASEへの適用
オブジェクト指向モデリングおよび設計を用いたラピッドプロトタイピングツールMuseの開発
ラピッドプロトタイピングツールMuse(2) : MVCモデルを利用したオブジェクト指向開発
ラピッドプロトタイピングツールMuse(1)
社会情報システムのためのラピッドプロトタイピングツールMuseの開発
社会情報システムのためのラピッドプロトタイピングツールMuseの開発
マルチモーダルUIとラピッドプロトタイピング
マルチモーダルUIとラピッドプロトタイピング
マルチモーダルUIデザイン支援ツールの開発
階層型アーキテクチャに基づいたWebベースMMIシステムの開発(一般セッション,クロスモーダル)
階層型アーキテクチャに基づいたWebベースMMIシステムの開発(一般セッション,クロスモーダル)
階層型アーキテクチャに基づいたWebベースMMIシステムの開発(一般セッション,クロスモーダル)
階層型アーキテクチャに基づいたWebベースMMIシステムの開発(一般セッション,クロスモーダル)
大規模音声ドキュメントを対象とした高速キーワード検索システムとその評価
1U-10 調音特徴に基づく音素単位での英語発音誤り検出と発音評価(音声分析・強調,学生セッション,人工知能と認知科学,情報処理学会創立50周年記念)
AAMを利用した表情成分抽出に基づく表情模倣システム(テーマ関連,顔・人物・ジェスチャ・行動)
AAMを利用した表情成分抽出に基づく表情模倣システム(テーマ関連,顔・人物・ジェスチャ・行動)
英語発音学習のための調音特徴抽出と発音評価
階層的MMIアーキテクチャに基づくプラットフォーム実装方法の検討
調音運動HMMに基づくワンモデル音声認識合成
Suffix Arrayを用いた高速なキーワード検索
5U-2 柔軟なモジュール切替が可能なWebベースMMIシステムの開発(音声インタフェース・システム,学生セッション,人工知能と認知科学,情報処理学会創立50周年記念)
KL展開と一般化確率降下法によるセグメント量子化の高速化
高速版SMQ/HMMによる不特定話者音声認識
4Y-5 AAMを利用した表情の模倣(顔・人物画像処理(2),学生セッション,人工知能と認知科学,情報処理学会創立50周年記念)
E-039 MMI6階層モデルに準拠したWebベースMMIシステムの開発(自然言語・音声・音楽,一般論文)
複合音響特徴平面(MAFP)とLDAに基づく音響特徴抽出法
複合音響特徴平面(MAFP)とLDAに基づく音響特徴抽出法
複合音響特徴平面(MAFP)とLDAに基づく音響特徴抽出法
複合音響特徴平面(MAFP)とLDAに基づく音声認識のための特徴抽出
複合音響特徴平面(MAFP)に基づく音声特徴抽出
複合音響特徴平面(MAFP)に基づく音声特徴抽出
複合音響特徴平面(MAFP)に基づく音声認識のための新しい特徴抽出法
最小分類誤り学習による特徴選択型文字認識
最小分類誤り学習による特徴選択型文字認識
5. GUIからマルチモーダルUI(MUI)に向けて (<解説> 音声言語情報処理の現状と研究課題)
パネル討論「マルチメディアを斬る!」[10] マルチメディアを快適に使いこなすために
インタラクティブなシステムの評価をどのように考えていくか
音声認識技術を用いた操業操船支援システム
変形文字を用いた認識辞書の作成
マルチメディアと信号処理(1)
マルチメディアと信号処理(2)
マルチメディアと信号処理(3)
調音運動に基づくワンモデル音声認識合成方式(合成,認識,理解,対話,一般)
4-3 マルチモーダル対話システム基盤技術とその応用(4.人間の活動を支援する応用技術,人間を理解するためのICT技術-人間を対象としたセンシング・情報処理からその応用まで-)
Suffix Arrayを用いた高速STDにおけるキーワード分割に関する理論的検討(ポスターセッション,第13回音声言語シンポジウム)
Suffix Arrayを用いた高速STDにおけるキーワード分割に関する理論的検討(ポスターセッション,第13回音声言語シンポジウム)
発音訓練のための調音特徴に基づくIPA母音図へのリアルタイム表示(ポスターセッション,第13回音声言語シンポジウム)
発音訓練のための調音特徴に基づくIPA母音図へのリアルタイム表示(ポスターセッション,第13回音声言語シンポジウム)
最適な状態構造における調音運動に基づいた高精度な音素認識(ポスターセッション,第13回音声言語シンポジウム)
最適な状態構造における調音運動に基づいた高精度な音素認識(ポスターセッション,第13回音声言語シンポジウム)
Active Appearance Modelsを用いた表情合成におけるパラメータ探索法の改良(一般セッション,時系列パターン認識)
Active Appearance Modelsを用いた表情合成におけるパラメータ探索法の改良(一般セッション,時系列パターン認識)
顔領域の違いによる読話認識性能比較(ポスターセッション,第13回音声言語シンポジウム)
顔領域の違いによる読話認識性能比較(ポスターセッション,第13回音声言語シンポジウム)
顔領域の違いが読話性能に与える影響について(一般セッション,時系列パターン認識)
顔領域の違いが読話性能に与える影響について(一般セッション,時系列パターン認識)
Webブラウザ上でMMIシステムを実行可能にするJavaScriptライブラリMMI.jsの提案
Webブラウザ上でMMIシステムを実行可能にするJavaScriptライブラリMMI.jsの提案
音声と画像シーンを用いた潜在意味解析に基づくタスク推定
調音特徴抽出に基づくIPAチャートへの英語発音リアルタイム表示(オーガナイズドセッション「第一・第二言語の獲得・学習にまつわる諸現象の分析と工学的応用」2,聴覚・音声・言語とその障害/一般)
調音特徴-声道音響パラメータ変換を用いた調音特徴HMM音声合成(音声,聴覚)

最小分類誤り学習による特徴選択型文字認識

スポンサーリンク

概要

著者

関連論文

スポンサーリンク