曲面に書かれた文字列の抽出と補正(テーマセッション(1),文字認識・文書理解)
スポンサーリンク
概要
- 論文の詳細を見る
曲面に書かれた文字は,斜め撮影により,直線的に書かれた文字列が湾曲してしまう.本稿では,このような湾曲文字列を抽出・補正する手法を提案する.提案手法では,文字列の一般的な特徴を利用して抽出を行う.まず,"文字とその背景の輝度差が高い","一つの文字列内で文字の色は同じ"という特徴より,エッジベースで局所的な2値化を行う.次に,"文字の大きさが等しい","文字の間隔が短い","局所的な直線性"という特徴から,領域を連結することで文字列を抽出する.次に,文字列の湾曲を2次多項式で近似し,文字列領域を求める.最後に求めた湾曲モデルを利用して,湾曲を直線的に補正する.実験により,斜め撮影によって湾曲した文字列でも抽出でき,その補正も良好な結果であることを確認した.また,抽出精度は平均適合率60.5%平均再現率62.7%となった.
- 社団法人電子情報通信学会の論文
- 2006-02-17
著者
-
松本 哲也
名古屋大学大学院情報科学研究科メディア科学専攻
-
工藤 博章
名古屋大学大学院情報科学研究科メディア科学専攻
-
榛葉 武士
名古屋大学大学院情報科学研究科・メディア科学専攻
-
竹内 義則
名古屋大学情報セキュリティ対策推進室
-
大西 昇
名古屋大学 大学院 工学研究科 情報工学専攻
-
松本 哲也
名古屋大学大学院
-
榛葉 武士
名古屋大学情報科学研究科・メディア科学専攻
-
工藤 博章
名古屋大学大学院情報科学研究科
-
竹内 義則
名古屋大学 情報セキュリティ対策推進室
-
工藤 博章
名古屋大学大学院工学研究科情報工学専攻
-
大西 昇
名古屋大学
-
松本 哲也
名古屋大学 大学院情報科学研究科 メディア科学専攻
関連論文
- 視覚障害者向け商品情報取得システム (福祉情報工学)
- 難聴者のための,会議における発言聴取支援システム(肢体障害・聴覚障害,HCGシンポジウム)
- ラベル要素検出とモデル照合による商品棚ラベル認識 (情報論的学習理論と機械学習)
- ラベル要素検出とモデル照合による商品棚ラベル認識 (パターン認識・メディア理解)
- 視聴覚事象の中心的事例の教師なし学習
- 重なり合う物体の輪郭線抽出 : 頂点組み合わせ決定と輪郭線生成の改良
- A-19-13 聴覚障害者の講義におけるハウリング音の位置検出(A-19.福祉情報工学,一般講演)
- 安全運転支援のための緊急自動車のサイレン音の検出
- 指示語に対応する指示対象抽出による遠隔パソコン要約筆記者支援の提案
- 曲面に書かれた文字の抽出(テーマセッション: マルチメディアコンテンツ, データ工学とメディア理解との融合)
- 小数標本時における階層型ニューラルネットの汎化能力の実験的評価-胃X線二重造影像の場合-
- webページ中のテキストと表からの重要個所抽出
- E-18 Webページの主題推定(情報抽出,E.自然言語・文書)
- タッチパネル操作における視覚障害者の指の誘導法(聴覚と福祉情報工学・一般)
- Linear GP with Redundancy-removed Recombination for Synthesis of Image Feature Extraction Programs
- 画像内のオブジェクトに注目した画像内容検索(一般セッション(2))
- 指向性マイクロホンの近接配置における周波数領域ブラインド音源分離の性能評価(電気音響,音響一般)
- 時系列キー入力データの分析結果に対する一考察
- 動画間の差異検出に基づくスポーツフォーム教示システム(一般,顔・人物・ジェスチャ・行動)
- 動画間の差異検出に基づくスポーツフォーム教示システム(一般,顔・人物・ジェスチャ・行動)
- スーパーピクセルを用いた対応付けによる室内の領域分割(一般セッション1)
- スーパーピクセルを用いた対応付けによる室内の領域分割(一般セッション1,三次元画像,多視点画像)
- スーパーピクセルを用いた対応付けによる室内の領域分割(一般セッション1,三次元画像,多視点画像)
- A-10-7 移動音源存在時の指向性マイクを利用したブラインド音源分離
- 分離パラメータ収束点推定を用いた源信号分離の収束性能の向上
- ラベル要素検出とモデル照合による商品棚ラベル認識(一般セッション,コンピュータビジョンとパターン認識のための機械学習と最適化,一般)
- ラべル要素検出とモデル照合による商品棚ラべル認識(一般セッション,コンピュータビジョンとパターン認識のための機械学習と最適化,一般)
- 大規模画像処理のための並列協調型ニューラルネットワークの一実現方式
- 幾何学的観点から見た多層パーセプトロンの能力評価
- ニューラルネットワークと画像の認識・理解
- 視覚障害者向け商品情報取得システム
- タッチパネル操作における視覚障害者の指の誘導法
- 視覚障害者の共有資料観覧支援システム
- 生物に示唆を得た選択的注意による視聴覚事象の対応付け手法
- 事前学習を用いないオンラインでの話者識別(聴覚・音声・言語とその障害,一般)
- 物体操作による視聴覚事象の対応付け
- 事前学習を用いないオンラインでの話者識別
- 類似画像検索における部分教師付き特徴次元圧縮
- Linear GP with redundancy-removed recombination for synthesis of image feature extraction programs (数理モデル化と問題解決・バイオ情報学)
- Gauss-Newton Particle Filter(Systems and Control)
- リアルタイム字幕作成支援のための数式抽出
- 物体操作による視聴覚事象の対応付け(ヒューマンコミュニケーショングループ(HCG)シンポジウム)
- 検索 : 組合せ法を用いた単眼画像からの三次元人物姿勢推定(テーマ関連セッション2)
- 検索-組合せ法を用いた単眼画像からの三次元人物姿勢推定(テーマ関連セッション,事例ベースメディア解析)
- Retrieval-Combination法を用いた単眼画像からの3次元人物姿勢推定
- Fast Human Pose Retrieval Using Approximate Chamfer Distance (特集:電気関係学会東海支部連合大会)
- 実環境音源分離におけるフィルタタップ数の低減手法
- 実環境音源分離におけるフィルタタップ数の低減手法
- A-10-6 マイクの近接配置による音源分離の性能評価と考察
- 運動で生じた視聴覚事象の対応付け(映像メディアおよび一般 : インターネット, デジタル放送, マルチメディア, 三次元画像, 視覚と画質評価, ITS等)
- 運動で生じた視聴覚事象の対応付け
- 運動で生じた視聴覚事象の対応付け
- F-13 指向性マイクを利用した移動音源分離(音声・音声言語情報処理,F.音声・音楽)
- 並列協調型ニューラルネットワークの実装と画像処理への応用
- 計算機群の同時稼働環境における大規模画像処理のための並列協調型ニューラルネットワーク
- Teager Energy Operatorを使用した音声感情認識(一般, STRAIGHTスペシャルセッション(SS))
- 感情に関係する特徴量の検討(視聴覚情報処理及び一般)
- 振動子を用いた感情モデルとそのロボットへの応用
- 振動子を用いた情動モデルとそのロボットへの応用
- リアルタイム字幕作成支援のための数式抽出 (福祉情報工学)
- Acceleration of Genetic Programming by Hierarchical Structure Learning : A Case Study on Image Recognition Program Synthesis
- A-19-14 伝音難聴者のための会議聴取支援システムの提案(A-19.福祉情報工学,一般講演)
- 感情に関係する特徴量の検討
- 視覚障害者のための環境内文字情報獲得支援システムにおける文字列抽出率の向上と音声出力の順位付け(ヒューマンインフォメーション)
- 視覚障害者のための環境内の文字情報抽出システム
- 視覚障害者のための環境内の文字情報伝達システム抽出精度の向上と音声出力の順位付け(テーマセッション(2))(ユビキタスコンピューティングのためのパターン認識・理解)
- 囲碁盤面の評価方法(セッション(2) : ゲーム情報学(2))
- 単語の頻度統計を用いた文章の類似性の定量化 : 部分的類似性の考慮(自然言語処理)
- 視覚障害者のための環境内の文字情報抽出システム : 音声出力における順位付け
- 視覚障害者のための環境内の文字情報抽出システム : 音声出力における順位付け(自動車・交通におけるコミュニケーション&インターフェース : 人にやさしい交通をめざして)
- 視覚障害者のための環境内の文字情報抽出システム : 音声出力における順位付け(自動車・交通におけるコミュニケーション&インターフェース : 人にやさしい交通をめざして)
- 視覚障害者のための環境内の文字情報抽出システム : 音声出力における順位付け(自動車・交通におけるコミュニケーション&インターフェース : 人にやさしい交通をめざして)
- ロボットへの物体位置伝達を目的とした指差し動作と指示代名詞の併用
- 音源数の変化を伴う音源分離(研究速報)
- 音源数の変化を伴う音源分離(アレー信号処理・音響計測/一般)
- マイクの近接配置における周波数領域ブラインド音源分離の性能評価(音響信号処理/一般)
- マイクの近接配置における周波数領域ブラインド音源分離の性能評価(音響信号処理/一般)
- 囲碁の中盤における評価関数
- D-8-2 コンピュータ囲碁における眼型計算法
- G-30 コンピュータ囲碁 : 人間の直感に近い勢力計算モデル(人工知能(一般),G.人工知能)
- e-Learningにおけるベイジアンネットワークを用いた学習者特性の推定(新しいインターネット技術の教育環境への利用/一般)
- DETERMINATION OF CORRESPONDENCE BETWEEN AUDIO AND VISUAL EVENTS THROUGH ACTIVE MOTION(International Workshop on Advanced Image Technology 2007)
- DETERMINATION OF CORRESPONDENCE BETWEEN AUDIO AND VISUAL EVENTS THROUGH ACTIVE MOTION
- Lawn Weeds Detection Methods Using Image Processing Techniques
- 非線形な制御対象での音源定位能力の自己組織的獲得
- 聴覚障害者のための警告音の識別(聴覚・音声・言語とその障害, 一般)
- VR手法による柔軟物体のソリッドモデリング
- マイクロホンアレーによるクラクションの同時定位(音響・超音波サブソサイエティ合同研究会)
- 大規模分散型情報処理教育システムの一構成方法
- A-4-47 実環境音源分離におけるタップ数の低減
- WEBベース学習における学習履歴に基づく統計的学習者モデルの構築( 遠隔教育/一般)
- 頻度統計と概念辞書を用いた文章の類似性の定量化
- E-19 文章の類似性の定量化(情報抽出,E.自然言語・文書)
- リカレントニューラルネットによる時系列顔表情からの特徴抽出
- 3D地図を利用した写真中の山名提示システム
- 画像内のオブジェクトに注目した画像内容検索
- スティックスリップ音の不快要因 : ピーク周波数と包絡線
- 色覚異常のための代表色の分布に基づいた画像変換
- 視覚障害者の商品情報取得を支援する画像-音声変換システム(視聴覚技術,ヒューマンインタフェース)
- オブジェクトと背景への画像の領域分割(視聴覚技術,ヒューマンインタフェース)