ランレングス補正を用いた画質劣化にロバストな特徴抽出法
スポンサーリンク
概要
- 論文の詳細を見る
従来の文字認識では, 幾何学的特徴抽出を基本とする形状変動にロバストな手法とテンプレートマッチングを基本とする画質劣化にロバストな手法が個別に提案されており, 両方の品質低下にロバストな手法は実現されていない.本報告では, 幾何学的特徴として文字線のランレングスを計測する際, 計則されたランレングス値を画像の劣化状態の推定に基づいて補正し, 劣化のない場合に得られるランレングスの近似値を求めることにより, 画質劣化に対するロバスト性を高めた特徴抽出法を提案する.人工的に劣化させた手書き文字を用いた認識実験により, 提案手法の有効性を示す.
- 社団法人電子情報通信学会の論文
- 2001-07-12
著者
-
萩田 紀博
エイ・ティ・アール知能ロボティクス研究所
-
萩田 紀博
日本電信電話株式会社 NTTコミュニケーション科学研究所
-
武川 直樹
東京電機大学情報環境学部情報環境工学科
-
武川 直樹
日本電信電話株式会社NTTCS基礎研究所
-
森 稔
東京女子医科大学ireiims:nttコミュニケーション科学基礎研究所
-
澤木 美奈子
日本電信電話株式会社NTTコミュニケーション科学基礎研究所
-
森 稔
日本電信電話株式会社コミュニケーション科学基礎研究所
-
澤木 美奈子
NTTコミュニケーション科学基礎研究所
-
森 稔
日本電信電話株式会社nttコミュニケーション科学基礎研究所
-
武川 直樹
日本電信電話株式会社 NTTCS基礎研究所
関連論文
- マルチメディアコンピューティング〔VI・完〕 : 知的メディア処理
- ベクトル量子化によるマルチスペクトル画像特徴表現と画像検索
- ベクトル量子化によるマルチスペクトル画像特徴と表現と画像検索
- 擬人化エージェントの印象操作のための視線制御方法(インタラクション技術の革新と実用化)
- TV会議用フレーム間符号化方式の検討
- D-7-7 診断サポートに向けた臨床データの健康度推定(D-7. MEとバイオサイバネティックス,一般セッション)
- ベクトル量子化によるマルチスペクトル画像検索(画像処理,画像パターン認識)
- 適応的領域分割と閾値推定を用いた高速テンプレートマッチング(一般セッション,コンピュータビジョンとパターン認識のための機械学習と最適化,一般)
- 適応的領域分割と闘値推定を用いた高速テンプレートマッチング(一般セッション,コンピュータビジョンとパターン認識のための機械学習と最適化,一般)
- ランレングス補正を用いた画質劣化にロバストな特徴抽出法(画像処理, 画像パターン認識)
- 歩行動作特性からの年齢層の推定
- ユーザとのコミュニケーションにおける擬人化エージェントの視線移動制御
- 劣化推定に基づいた辞書の自動選択による本棚画像中の文字認識
- テンプレート学習による本棚画像中の文字認識
- 複数情報が重畳した尺八譜認識に関する一検討
- 周囲文字を含んだ参照パターンによる本棚画像中の文字認識
- 辞書の自動選択による本棚画像中の文字認識
- 変形推定に基づいた参照パターンの自動選択による文字認識
- 複数情報が重畳した文字列認識の一検討 : 尺八譜認識の例
- ディジタルカメラのズーム機能を利用した文字認識
- 2点補正による簡易キャリブレーションを実現した視線測定システム
- 視線測定による遠隔地映像対話の解析
- 視線測定による遠隔地映像対話の解析
- コミュニケーションにおける視線の役割 : 視線が伝える意図・気持ち
- 焦点距離制御を用いた情景内文字認識
- 焦点距離制御を用いた情景内文字認識
- 焦点距離制御を用いた情景内文字認識
- 流し目の効果 : 視線と顔方向から受ける印象の評価
- 目で操作するコンピュータのための視線測定システム (特集 人間情報科学が切り拓くコミュニケーションの未来)
- 撮影距離の変化に対する情景内文字の認識特性
- D-12-6 ランレングス補正に基づく劣化手書き文字認識のための特徴抽出法
- ランレングス補正を用いた画質劣化にロバストな特徴抽出法
- ランレングス補正を用いた画質劣化にロバストな特徴抽出法
- ランレングス補正を用いた画質劣化にロバストな特徴抽出法
- 眼球形状モデルに基づく視線測定システム : 視線入力デバイスの実現に向けて
- ビジョン技術によるコミュニケーション環境理解--視線を用いたコミュニケーション支援 (特集論文1 人にやさしい対話型コンピュータ)
- 「パターン認識・理解」から「パターン認識・メディア理解」へ
- S2-4 背景予測を導入したTV会議用符号化方式
- テレビ会議用フレーム間符号化装置
- ビデオ符号化用LSI化D/D変換回路
- 7-7 LSIを用いたフレーム内符号化装置の構成
- 7-6 6.3Mb/sフレーム間符号化装置の構成
- テレビ会議画像用1.5Mb/sフレーム間符号化方式の構成
- LSI向きフレーム内直接予測符号化方式の構成
- 7-9 フレーム間符号化用プレフィルタの特性
- 駒落し符号化の主観評価実験(視覚と画質)
- 動画像のフィールド処理に関する検討
- 10-5 移動量を用いたTV画像の予測と補間の検討
- 一様範囲の推定を用いたテクスチャ画像の領域分割
- 多値画像中の文字列切り出しに関する一検討
- 劣化文字にロバストな識別関数の学習に関する検討
- POMDPを利用した思考喚起型対話の制御(対話,第10回音声言語シンポジウム)
- POMDPを利用した思考喚起型対話の制御(対話,第10回音声言語シンポジウム)
- POMDPを利用した思考喚起型対話の制御(対話,第10回音声言語シンポジウム)
- まつしゅるーむの世界 : 環境知能の実現
- 国際会議報告:ICPR2000とその周辺
- 多重スケールフィルタを用いたカラーテクスチャ画像の領域分割
- 特徴補正に基づくカテゴリー依存特徴抽出法による映像中文字認識(画像認識,コンピュータビジョン)
- 画質劣化文字認識のためのカテゴリに依存した特徴抽出法
- 店舗環境内の停留位置系列から推定した顧客の興味に基づく誘導の実現
- ユビキタスマーケットプラットフォームにおける店舗内外連携による顧客案内動作の実現
- DP-1-3 異種ロボット連携による買い物支援(DP-1.ネットワークロボットからクラウドネットワークロボットヘ,パネルセッション,ソサイエティ企画)
- DP-1-2 ユビキタスネットワークロボット研究開発プロジェクト : 全体像と中間成果総括(DP-1.ネットワークロボットからクラウドネットワークロボットヘ,パネルセッション,ソサイエティ企画)
- 視線の機能に着目した映像切り替え規則とその効果 : 人に分かりやすい映像生成を目指して(ヒューマンコミュニケーション及び一般)(ヒューマンコミュニケーショングループ(HCG)大会)
- A-15-9 視線情報に基づく映像切り替え規則とその評価
- 適応的領域分割と初期しきい値推定によるテンプレートマッチングの高速化(画像・映像処理)
- 特徴補正を用いたカテゴリ依存特徴抽出法による映像中文字認識
- デザイン処理された新聞見出し画像の文字認識法
- 補完類似度に基づく新聞見出し文字の領域抽出と認識
- 補完類似度による劣化印刷文字認識
- 低品質文字の認識手法とその応用に関するサーベイ(PRPRサーベイシリーズ)
- 補完類似度による低品質文字認識--文字を認識するコンピュ-タ (特別企画 ヒュ-マノイドテクノロジ&サイエンス)
- 多視点観測に基づく複数物体の相互オクルージョン解析と逐次状態推定
- 店舗環境内の停留位置系列から推定した顧客の興味に基づく誘導の実現(ライフサポート,グループウェアとネットワーク,ライフログ活用技術,一般)
- コミュニケーションロボットによる領域参照のための直示的インタラクションのモデル化
- 複数の案内ロボットが連携してサービス提供するネットワークロボットシステムの実現
- twitterを用いた即応性の高いQ&A仲介エージェントの提案(一般セッション(1),クラウドでつながるロボットサービス)
- ロボットの能動的接触は人間のモチベーションを上げるか(エージェントデザイン,人とエージェントのインタラクション論文)
- 擬人化エージェントとの音声対話時におけるユーザの非言語動作からの難/易及び興味/退屈の推定(ユーザ状態推定,人とエージェントのインタラクション論文)
- コミュニケーションロボットのための発話とジェスチャのアサインパターンの抽出とその発展的開発手法の提案(対話生成,人とエージェントのインタラクション論文)
- 人々との身体的なインタラクションを行う小型ロボットのための慣性センサを用いた個人同定手法の確立(ユーザ状態推定,人とエージェントのインタラクション論文)
- 大局的構造情報を用いたオンライン数字認識 (パターン認識・メディア理解)
- ロボット発話の冗長性制御による指示物体認識性能向上への寄与
- 店舗内での顧客の停留領域系列に基づいたロボットからの商品推薦(知能ロボット,ライフログ処理技術とその活用システム論文)
- クラウドによるロボットの発話とジェスチャのアサインパターンの抽出とその発展的開発手法(地理空間情報とロボットと人と)
- 対話行動認識プラットフォーム
- DP-1-3 多地点を連携して動くロボットサービス実証実験 : ユビキタスネットワークロボット・プラットフォーム(DP-1.クラウドネットワークロボットのワイガヤ実験場の実現に向けて,パネルセッション,ソサイエティ企画)
- ベクトル量子化によるマルチスペクトル画像特徴表現と画像検索
- 多重領域ヒストグラムを用いた高速なウィンドウサーチ(物体認識,文字・文書,医用画像,第14回画像の認識・理解シンポジウム推薦論文,画像の認識・理解論文)
- 大局的構造情報を用いたオンライン数字認識(テーマセッション,実世界文字認識と理解)
- コミュニケーションロボットによる道案内 : ジェスチャの有用性と発話タイミングのモデル化(人工知能,データマイニング)
- 複数パンチルトカメラによる高解像度3次元映像撮影システム(一般セッション,人の視聴覚情報処理とPRMUの接点)
- 顧客の軌跡データを利用した実購買行動解析による購買・非購買推定(行動解析,ユーザ属性情報,ライフログ活用技術,オフィスインフォメーションシステム,ライフインテリジェンス,一般)
- 複数パンチルトカメラによる高解像度3次元映像撮影システム(一般セッション,人の視聴覚情報処理とPRMUの接点)
- 多重領域ヒストグラムを用いた高速なウィンドウサーチ
- 大局的特徴に対するDPマッチング