オプティカルフローとHMMを用いた駅名発話画像認識の試み
スポンサーリンク
概要
- 論文の詳細を見る
口唇周りのオプティカルフローと単語HMMを用いた駅名発話画像認識システムについて述べる.本システムでは,オプティカルフローの抽出を専用ハードウェア「カラートラッキングビジョン」により行い,得られた特徴ベクトルをベクトル量子化によりシンボルに変換し,離散出力分布型HMMによる学習および認識を行う.特定話者における駅名50単語の認識実験より,平滑化したオプティカルフロー測定値を50画素間隔に間引いた80次元の特徴ベクトルが最も高い認識性能を与えること,状態数26の単語HMMが最も高い認識性能を与えること,また,摂動データを学習データとした場合,位置ずれなしで97%,25画素程度の位置ずれを許容して96.7%,50画素程度の位置ずれを許容しても92.4%と非常に高い認識性能が得られることなどがわかった.
- 社団法人電子情報通信学会の論文
- 2002-11-15
著者
関連論文
- オプティカルフローとHMMを用いた駅名発話画像認識の試み
- オプティカルフローとHMMを用いた駅名発話画像認識の試み
- 方向量子化探索手法(VQSM)を用いた4足ロボットの歩行パターン自己形成
- 長さの異なるセグメントを組み合わせた音声認識のための特徴ベクトルの構成法
- ニューラルネットを用いた移動ロボット車の動的環境における走行制御法
- SP2000-24 文間のハミング距離に基づいた言語モデルの評価尺度
- ニューラルネットを用いた移動ロボット車における軌道生成時間の短縮
- ニューラルネットワークを用いた顔の向きによらない人物画像の識別
- 音声認識のための特徴ベクトルの構成法の検討-第3報
- セグメント単位入力におけるセグメント形状の検討
- ケプストラムとデルタケプストラムから成るセグメントの性質 : 対称型と非対称型の比較
- 音声認識における2段窓セグメント単位入力の有効性
- 音声認識における2段窓セグメント単位入力の有効性
- 音声認識に適した特徴ベクトルの構成の検討
- 離散型HMMにおけるDWWSの効果
- 音声認識のための特徴ベクトルの構成法の検討-第2報
- マルチテンプレートによる可変DWWS-LVQ音声認識システムの検討
- 音声認識のための特徴ベクトルの構成法の検討-第1報
- 2段窓セグメント単位入力を用いたLVQ音声認識システムの検討
- 自動学習によって付与された音素ラベルの性質
- ニューラルネットを用いた移動ロボット車の障害物回避走行制御
- P形フーリエ記述子を用いた手書き文字のオンライン筆者識別
- 局所結合型神経回路網モデルによる手書き漢字の効率的認識法
- P形フーリエ記述子を用いたオンライン手書き漢字認識
- 神経回路モデルを用いたオンライン手書き漢字認識 (ニュ-ロコンピュ-ティング論文)
- 線図形の曲りを特徴としたオンライン手書き漢字認識
- 神経回路モデルによる母音スペクトルの学習と識別機構
- 神経回路モデルによる母音知覚分布の学習と識別
- 閉磁路をもつ一枚板パ-マロイ磁心の磁壁移動と磁束パタ-ンの観察
- 複合セグメント長離散型HMMの検討
- LVQ音声認識システムにおける自動学習の効果
- 画像処理を用いた積雪深さの自動計測システム
- 学習オートマンのしきい素子による構成とその実現
- 音素・文字間の遷移情報を用いた単語認識の性能予測
- カテゴリ間の遷移情報を用いた文認識系の能力評価法
- 言語情報を利用した文字認識における文字認識率と単語認識率の関係
- 神経回路網のモデルにおける学習アルゴリズムの改良と手書き文字の3段階認識法
- 単語の出現確率を用いた単語認識の性能予測
- 有限状態オートマトンを用いた文認識系の能力評価 : 単語認識率と文認識率の関係
- アモルファス磁性薄膜を用いた未知磁性体形状の画像処理による検出 (画像処理特集) -- (産業,医用,リモ-トセンシングへの応用)
- 切り替わるパラメ-タと有色観測雑音を有する線形離散確率システムの適応制御
- 有色雑音を含む線形離散値系の適応形システム同定
- 非破壊読み出し用パルス幅変調器の一応用例--過渡応答直視装置
- プッシュプル形非破壊読み出し用パルス幅変調器
- ニューラルネットによる移動ロボット車の遠心力を考慮した目標時間可変型走行制御アルゴリズム
- 磁路長によるパルス幅変調器の非破壊読出し動作解析
- 非破壊読出し用パルス幅変調器における記憶保持特性のシミュレ-ション
- 文間のハミング距離に基づく言語モデルの評価法の検討