文字認識と単語レイアウト解析を用いた紙文書とデジタルデータの情報リンク手法(テーマセッション: マルチメディアコンテンツ, データ工学とメディア理解との融合)
スポンサーリンク
概要
- 論文の詳細を見る
文字認識と単語レイアウト解析技術を用いて, 読み取った複数単語の配置関係から, 文書の種別や読み取り位置を特定する手法を提案する.また, この手法を用いて, 紙文書とデジタルデータのハイパーリンクを実現するプロトタイプを開発した.具体的には, カメラ付き携帯電話で紙面上の複数の単語を読み取って, その認識結果と単語の配置関係をサーバに送信し, サーバ側であらかじめ作成しておいたテキストデータと照合して, 文書の種別, ページ番号, ページ中の位置を特定し, 関連する情報を携帯電話に返信する.この技術を用いれば, バーコード等を文書に印刷することなくハイパーリンクが実現できる.また既に出版された文書に新たなサービスを付加することができる.4種の新聞を用いた小規模な実験で, 97%の精度で新聞種の特定を, また新聞種が特定できればほぼ正しいページ位置を特定できることがわかった.今後は実験の規模を拡大するとともに, 本方式を用いた様々なサービスの検討を行う予定である.
- 社団法人電子情報通信学会の論文
- 2005-06-10
著者
-
嶺 竜治
(株)日立製作所中央研究所知能システム研究部
-
亀山 達也
(株)日立製作所中央研究所組込みプロセッサ研究部
-
緒方 日佐男
日立オムロンターミナルソリューションズ株式会社
-
嶺 竜治
(株)日立製作所知能システム研究部
-
古賀 昌史
株式会社日立製作所中央研究所
-
嶺 竜治
株式会社日立製作所中央研究所
-
高橋 寿一
(株)日立製作所中央研究所
-
亀山 達也
株式会社日立製作所中央研究所
-
高橋 寿一
株式会社日立製作所中央研究所
-
緒方 日佐男
日立オムロンターミナルソリューションズ(株)
-
古賀 昌史
(株)日立製作所機械研究所
-
嶺 竜治
(株)日立製作所中央研究所
-
古賀 昌史
(株)日立製作所 中央研究所
関連論文
- 文字認識と単語レイアウト解析を用いた紙文書とディジタルデータの情報リンク手法(画像認識,コンピュータビジョン)
- ABP-1-2 指静脈認証技術と金融分野への応用(ABP-1.バイオメトリクス認証を活用したシステム設計,パネルセッション,ソサイエティ企画)
- 児童の論理的な読み書き能力を育む思考の相互観察活動 : デジタルペン黒板システムを使用した授業実践から
- ヒューマノイド--ロボットがつなぐ人間・機械・情報 (特集 人間を指向した研究開発)
- 距離に基づく確信度を利用した文字識別手法(一般セッション(2))(ITS・監視・セキュリティのためのパターン認識・メディア理解)
- D-11-93 文書画像に対する適応型 2 値化の一手法
- 端点対接続型かすれ修復方法の手書き線図形認識への適用
- 表記規則を持つ数字文字列の認識における文字列チェック機能の一検討
- 手書き線図形のかすれ修復方法の一提案
- 手書き漢字住所認識のためのエラー修正アルゴリズム
- 棒状図形に傾き検出のラン符号による高速化の一手法
- オートマトン型単語照合の姓名文字列への適用
- 文書の見出し記号の解析に基づく木状論理構造生成の一手法
- ABP-1-2 指静脈認証技術と金融分野への応用(ABP-1.バイオメトリクス認証を活用したシステム設計,パネルセッション,ソサイエティ企画)
- 将来都市交通要素としての自律移動技術 (特集 次世代都市)
- デジタルペンを用いた論理的思考を展開できる教育法の開発--現場教諭および児童・生徒からみた有効性の評価 (教育工学)
- デジタルペンを用いた論理的思考を展開できる教育法の開発--デジタルペン授業支援システムの開発と現場教材を用いた評価 (教育工学)
- N-gram言語統計量を併用した島駆動型文字列認識方式(画像認識,コンピュータビジョン)
- 文字認識と単語レイアウト解析を用いた紙文書とデジタルデータの情報リンク手法(テーマセッション: マルチメディアコンテンツ, データ工学とメディア理解との融合)
- 文字認識と単語レイアウト解析を用いた紙文書とデジタルデータの情報リンク手法(テーマセッション: マルチメディアコンテンツ, データ工学とメディア理解との融合)
- D-12-35 OCR機能を応用した携帯電話向け電子辞書機能の開発(D-12.パターン認識・メディア理解A)
- トライ辞書を用いた語彙情報駆動型の印刷地名単語列認識方式(画像処理,画像パターン認識)
- チェックライタ金額文字列認識の一手法
- 金額文字列認識の後処理のためのボトムアップ型構文解析の一手法
- I-66 サブバンドEHMMを用いた低解像度文字画像の高解像度化(画像高解像度化・劣化復元,I.画像認識・メディア理解)
- 単語探索型の文字列認識方式
- 超並列計算機の文字認識辞書構築処理への応用
- 4D-3 レイアウト解析による書誌情報の抽出(画像処理・認識(2),一般セッション,人工知能と認知科学,情報処理学会創立50周年記念)
- D-12-19 振込め詐欺防止のための複合画像特徴を用いた手検知による携帯電話利用検知(D-12. パターン認識・メディア理解,一般セッション)
- 回帰的遷移ネットワークを用いた文字経路探索方式の開発(テーマセッション,文字・文書の認識・理解)
- I-027 多重仮説検定を用いた割書・振り分け行に対応した文字行抽出方式(I.画像認識・メディア理解)
- 大画面映像通信における音像定位精度改善手法の一検討
- 人間共生ロボットの開発とデザイン(デザイン×技術=ものづくり)
- Bayesルールを用いた宛名記載領域抽出手法(文字とドキュメントの認識・理解)
- Bayesルールを用いた宛名記載領域抽出手法(文字とドキュメントの認識・理解))
- ベイズルールを用いた周辺情報統合による手書き漢数字の文字切出し手法(画像処理,画像パターン認識)
- 多重仮説方式を用いた宛名記載領域抽出手法
- D-12-19 縦横混在表記に対する住所表示番号照合方式
- 手書き接触漢字切出しに関する検討
- Bayesルールを用いた手書き漢数字の文字切出し手法
- アクセスゲートウェイへのネットワークプロセッサの適用
- 議事推移モデルを用いた知的遠隔会議支援に関する検討
- H-012 仮説検証型アプローチを用いた定義レス帳票認識技術(H分野:画像認識・メディア理解,一般論文)
- DPマッチングを用いた帳票枠構造照合方式
- K116 数学的文章題における図表活用方略を促す授業実践 : デジタルペンを生かした公立中学校での学習法講座から(口頭セッション19 算数2)
- ネットワークプロセッサを適用したパケットカプセル化方式の検討(ネットワークプロセッサ及び一般)
- ネットワークプロセッサを適用したパケットカプセル化方式の検討(ネットワークプロセッサ及び一般)
- C-024 組込みシステムのソフトウェア障害予兆検出に適した挙動情報収集手法の検討(C分野:ハードウェア・アーキテクチャ,一般論文)
- B-8-62 IP網用MPEG2階層映像伝送システム
- MPEG2を利用した階層符号化の実現
- IP網用MPEG2階層映像伝送システムの検討
- MPEG多重変換装置の開発
- 臨場感映像通信システムにおける音声再生の一検討
- デジタルペンを用いた論理的思考を展開できる教育法の開発--授業準備や授業運営の省力化に関する評価 (教育工学)
- 人間共生ロボットEMIEW2の開発(トピックス)
- チェックライタで印字した金額の認識の一手法--ノイズ、かすれに強い文字認識の一方式
- 体験記録検索における文字認識の有効性の評価
- テクノトレンド カメラ付き携帯電話向けの漢字認識技術
- 文字認識における文脈情報利用技術の将来
- 組込みシステムトレース技術とその応用
- 組込みシステムトレース技術とその応用
- オートマトン型単語照合の高速化手法
- 指静脈認証技術と金融分野を中心とした応用 (特集 自動認識--バイオメトリクスの最前線(part 2))
- 金融分野におけるバイオメトリクスの利用
- デジタルペンを用いた論理的思考を展開できる教育法の開発 : 授業準備や授業運営の省力化に関する評価(エンタテインメントを活用した学習環境/一般)
- デジタルペンを用いた論理的思考を展開できる教育法の開発 : 現場教諭および児童・生徒からみた有効性の評価(学習のユビキタス化とシステム構成技法/一般)
- デジタルペンを用いた論理的思考を展開できる教育法の開発 : デジタルペン授業支援システムの開発と現場教材を用いた評価(インタフェース技術と学習支援システム/一般)
- スキャンマッチングデータ合成のためのGibbsサンプリングを用いたオフラインマップマッチング(地理空間情報とロボットと人と)
- スキャンマッチングデータ合成のための Gibbs サンプリングを用いたオフラインマップマッチング
- 聞いて書く活動に関する実践的研究(1) : 「新聞記者になろう」でのメモを中心に(自由研究発表)
- 視写教育支援のための筆記過程の時系列解析(学習データの蓄積と利活用支援/一般)