音響類似性に基づく認識単位を用いた音声認識(音声情報処理 : 現状と将来技術論文特集)
スポンサーリンク
概要
- 論文の詳細を見る
本論文では, モデルに対する学習サンプル全体のゆう度が最大になるように学習サンプルを分割することで新たな認識単位を自動獲得するアルゴリズムを提案する.ここで得られる認識単位は, 時間的に連続した音素をいくつかまとめて一つのものとしたものであり, これをAcoustic Similarity-based Primitives(ASP)と呼ぶ.本論文で提案するアルゴリズムでは, ASPの獲得と, それをHMnetを用いてモデル化することを同時に行い, 両者を同時に最適化する.特定話者6名について行った音素認識実験の結果, 14.6%程度の平均候補数の増加で, 従来の音素HMnetに比べ平均で約3.5%の認識率の向上が見られた.またASPを大語彙連続音声認識システムに組み込む方法を提案する.特定話者8名について行った認識実験において, 単語認識精度が音素HMnetに比べて約2.6%向上した.
- 社団法人電子情報通信学会の論文
- 2000-11-25
著者
-
阿曽 弘具
東北大学大学院工学研究科
-
牧野 正三
東北大学大学院工学研究科
-
森 大毅
宇都宮大学工学部
-
鈴木 基之
東北大学大学院工学研究科
-
牧野 正三
東北大学大型計算機センター:大学院情報科学研究科
-
阿曽 弘具
東北大学大学院工学研究料
-
林 貴文
東北大学大学院工学研究科
-
森 大毅
宇都宮大学大学院工学研究科
関連論文
- 2値化とエッジ抽出による情景画像からの高精度文字列検出(画像認識,コンピュータビジョン)
- ベクトル空間へのグラフの埋め込みによるシルエット画像認識
- 編集距離と多次元尺度構成法によるシルエット画像認識(一般セッション11)
- 編集距離と多次元尺度構成法によるシルエット画像認識(一般セッション4,三次元画像,多視点画像)
- 輪郭の伝搬によるCT画像からの歯の半自動形状復元(研究速報)
- (332)工学教育プログラム基準強化活動(第1報) : コアリッションによる工学教育の相乗効果(セッション97 工学教育の個性化・活性化IX・国際化時代における工学教育V)
- 記憶容量制限下において手続き的知識を獲得する連想記憶モデル
- H-004 手続き的知識を獲得する連想記憶モデル(H.生体情報科学)
- 手続き的知識を獲得する連想記憶モデル
- 重み付き最小共通スーパーグラフを用いたシルエット画像認識
- NAT法とエッジ情報を利用した情景画像中の文字列検出(テーマセッション3,複合現実感のためのパターン認識・理解)
- モーフィングによる生成パターンを用いたシルエット図形認識(研究速報)
- ガンマ変換を用いた照明変動に頑健な物体検出(研究速報)
- 画像変形モデルを用いた図形の領域分割(一般,膨大なデータから学ぶもの)
- 2値化とエッジ抽出による情景画像からの高精度文字列検出
- 相互情報量と信頼度による予測選択を用いた実行時間予測手法(性能予測)
- プロセス情報を利用したリアルタイム計算機負荷予測手法(性能予測)
- P2Pネットワーク上での類似度検索のためのデータ配置方法(セッション3:P2Pネットワーク基盤)
- P2Pネットワーク上での効率的な類似度検索(セッションB-8:P2P・オーバーレイネットワーク(2))
- パイプライン化による遅延を考慮したShuffled BP復号法のスケジューリング(分散システム,コンピュータシステムのインタコネクト技術及び一般)
- LA-006 プロセス情報を利用した実行時間予測と信頼度による予測選択手法(モデル・アルゴリズム・プログラミング)
- プロセス情報と実行時間予測を利用した統合的計算機負荷長期予測手法(研究速報)
- LH_003 文脈に基づくモジュール切り替え型学習モデル(H分野:生体情報科学)
- 逐次学習型時系列予測モデル(ニューラルネットワーク及び生物工学)
- 非均質環境における誤差逆伝播法の矩形分割マッピングによる並列高速化(並列・分散処理アルゴリズム)
- LA-004 プロセス情報を用いた計算機負荷長期予測モデル(A分野:モデル・アルゴリズム・プログラミング)
- 記憶容量制限下で時系列を逐次学習するニューラルネットワーク(ニューラルネット)
- 非均質環境における誤差逆伝播法の矩形分割によるマッピング手法(一般講演1)
- L-013 移動エージェントを用いた負荷分散システム(L.インターネット)
- A-028 プロセス情報と負荷変動傾向を用いた計算機負荷長期予測モデル(A.モデル・アルゴリズム・プログラミング)
- A-2-27 非定常な時系列に対応した長期予測
- 階層的クラスタリングを用いた非均一環境におけるタスク割当て手法
- 非一様な並列計算機環境におけるニューラルネットワークの学習
- D-6-3 非同期式シストリックアレーの自動設計法
- 非均一ネットワークにおけるタスク割当て手法
- 非均一環境における高速タスク割り当てアルゴリズム
- GAを用いた非均一ネットワークにおけるタスク割り当て
- 非一様構造を考慮したシストリックアルゴリズム記述言語と処理系 (機能論理設計, アーキテクチャ設計支援と一般)
- シストリックアレーのハードウェア化支援
- シルエット図形のパーツ分解とカテゴリー分類法(パターン認識)
- AdaBoostアルゴリズムを用いた識別手法の統合(研究速報)
- 中心軸変換を用いたシルエット図形の構造化(画像認識,コンピュータビジョン)
- ヒストグラム構築コストを考慮した高速物体検出(画像・映像処理)
- 大域的枝刈りと回転状走査による物体の高速探索(パターン認識)
- I-021 枝刈り規則の簡素化と回転状走査による高速物体検出(I.画像認識・メディア理解)
- 枝刈り可能量の予測と探索開始点の考慮による色ヒストグラムを用いた画像探索の高速化
- 次元の縮退を利用した頑健な共分散行列の逆行列の推定法(一般セッション,パターン認識・メディア理解のための学習理論とその周辺)
- HITSアルゴリズムに基づく階層性を考慮したウェブコミュニティの抽出(データマイニング)
- トピック語の自動抽出によるウェブページ検索システム
- 孤立文字認識のための変形を許容する高速なテンプレートマッチング(画像認識,コンピュータビジョン)
- リンク構造を用いたウェブコミュニティ抽出法(情報抽出2,夏のデータベースワークショップDBWS 2006)
- リンク構造を用いたウェブコミュニティ抽出法(情報抽出)
- カラー情報と明度情報を利用した情景画像中の文字列の高精度抽出(研究速報)
- 情景画像中文字認識のための変形を許容する高速なテンプレートマッチング(一般セッション3)
- 情景画像中文字認識のための変形を許容する高速なテンプレートマッチング(一般セッション(3),CVのためのパターン認識・学習理論の新展開)
- H-013 系列の区切りを考慮した単純再帰ネットワークモデル(H分野:生体情報科学)
- 21世紀に向けて文字・文書メディアの認識・理解の夢と課題
- P2Pネットワーク上での効率的な類似度検索(セッションB-8:P2P・オーバーレイネットワーク(2))
- D-12-43 パターン認識のための適応的非線形次元圧縮法
- D-12-26 オンライン手書き行列の構造認識
- 伸縮変形隠れマルコフモデルと時系列認識への応用
- 伸縮変形隠れマルコフモデルと時系列認識への応用
- 混合非対称正規分布とその最尤推定法
- 混合修正2次識別関数による単仮説検定問題のための教師なし学習法
- 混合修正2次識別関数による単仮説検定問題のための教師なし学習法
- 伸縮変形モデルを用いた手書き文字認識
- 文字の大局的変形に関する一考察
- 多重解像度法を用いた文字認識用伸縮変形モデルの高精度化
- 複数ストローク対応型伸縮変形モデルによる平仮名認識
- シストリックアレーの高速化手法
- 非線形変換を用いたニューラルネットワークによる知識獲得法
- 音素ごとの木構造話者クラスタリングによる話者適応
- 音素毎の話者クラスタリングに基づく話者適応法
- 音素毎の話者クラスタリングに基づく話者適応法
- 音素毎の話者クラスタリングに基づく話者適応法
- 音素毎の話者クラスに基づく話者適応法
- SSS-freeに基づくHMnetにおけるVFSの効果
- D-6-14 完全二分木シストリックアレーについて
- F-010 多階層のリンクを考慮したWebコミュニティの抽出(F分野:人工知能・ゲーム)
- 様々な画像に適用できる文字パターン抽出手法について : サーベイおよび一構成例
- 局所多値しきい値処理による濃淡文書画像からの文字パターンの抽出
- D-12-12 微小文字パタン抽出のための多値しきい値処理の改良と後処理
- 文書画像のラベル付け法と文字抽出法
- 文字行の局所的な直線性を利用した任意方向文字行抽出法
- ハフ変換におけるパラメータの効率的なサンプリング間隔
- 文書中の非方形文章ブロックの抽出のためのアルゴリズム
- 雑音レベルの整形による効率的なハフ変換の構成
- 類似文字行の結合による文章ブロックの抽出
- 機能マップの自己組織化への統計力学的アプローチ(基研研究会「ニューラルネットワーク〜これからの統計力学的アプローチ〜」,研究会報告)
- 高速Lempel-Ziv符号化/復号化並列処理アーキテクチャ
- 文字特徴領域の重なり検出法
- 文字認識の高速化に関する一方法
- 標本共分散行列の固有ベクトルを用いた真のマハラノビス距離の推定法(パターン認識)
- 画像変形モデルを用いた図形の領域分割(一般,膨大なデータから学ぶもの)
- 編集距離と多次元尺度構成法によるシルエット画像認識(一般セッション4,三次元画像,多視点画像)
- 新しいネオコグニトロン型ネットワークとICA・PCAを用いた学習法(バイオサイバネティックス, ニューロコンピューティング)
- 図地反転知覚における視覚的注意のモデル
- 仮定と検証に基づく注視点移動によるパターン認識モデル(バイオサイバネティックス,ニューロコンピューティング)
- F-018 クラスタ抽出によるWebの検索結果の分類(F分野:人工知能・ゲーム)
- カラー情報を利用した情景画像中の文字列の高精度抽出(文書・文字メディアの認識・理解, 一般)