表層表現抽出と論理構造解析に基づく規程文書構造化技術の開発(テーマ : 社会の活動を支えるデジタルドキュメント)
スポンサーリンク
概要
- 論文の詳細を見る
近年、様々な社会的背景を元に、企業における内部統制対応が、社会的にも法的にも求められるようになった。その対応の一つとして、企業には、自社で定められている膨大な量の規程文書を、必要に応じて参照したり、また部門の改変や業務自体の変革に伴って最新の状態に更新したり、さらに一つの文書を改訂することで変更が波及する他の文書を正しく把握する必要などが求められている。こうしたニーズに対応することを目的として、我々は、企業内規程文書において閲覧、改訂などの活用支援を行う文書管理システムの試作を行った。本論文では、この文書管理システムの内部で用いられている文書構造化モジュールについてその詳細を述べる。文書構造化モジュールは、規程文書から抽出されたテキストを入力として、文書中の構造や意味に基づいたタグを付与し、事前定義されたタグ仕様に基づくXML文書を出力することを特徴とする。モジュールの精度評価を目的として、実際の規程をターゲットとして評価実験を実施し、タグ平均で85%の付与精度が得られたことを確認した。また、このモジュールでXML化された規程文書を活用するGUIプロトタイプを作成した。このプロトタイプにより、当初の規程文書活用に対する閲覧・検索支援といったニーズが機能として実現されていることをGUI上で検証した。
- 一般社団法人情報処理学会の論文
- 2007-09-28
著者
関連論文
- 文書の様々な活用を可能にするXML構造化技術 (特集 日本語ワードプロセッサIEEEマイルストーン認定記念 自然言語処理技術)
- オントロジーメンテナンスのための固有名詞抽出技術の検討(オントロジー,「Webインテリジェンス」及び一般)
- 5H-3 投稿情報に基づくビジネスメールの話題分類(自然言語処理,一般セッション,人工知能と認知科学)
- セマンティックWebのツール(セマンティックWeb)
- セマンティックWebにおけるメタデータとその活用(セマンティックWeb)
- 意味クラス解析と意図推定に基づくインタラクティブな情報検索インタフェース(ユーザインタフェースとインタラクティブシステム,インタラクションの理解とデザイン)
- 意味クラス解析と意図推定に基づくインタラクティブな情報検索インターフェース(テーマセッション1(テキスト処理・文字列画像処理),文字・文書の認識・理解)
- オントロジーメンテナンスのための固有名詞抽出技術の検討(オントロジー,「Webインテリジェンス」及び一般)
- 表層表現抽出と論理構造解析に基づく規程文書構造化技術の開発(テーマ : 社会の活動を支えるデジタルドキュメント)
- I-003 応用規格に基づいたXML文書への変換を可能とする紙文書を対象とした階層的文書変換システム(I分野:画像認識・メディア理解)
- XML文書変換を目的としたセル分類およびセル変形に基づく表構造解析(文書・文字メディアの認識・理解, 一般)
- XML文書変換を目的としたセル分類およびセル変形に基づく表構造解析(文書・文字メディアの認識・理解, 一般)
- XML文書変換を目的としたセル分類およびセル変形に基づく表構造解析
- XML文書変換を目的としたセル分類およびセル変形に基づく表構造解析
- 表層表現抽出と文書構造解析に基づくXML文書変換システム(セッション1 : Web文書生成・管理)
- キー概念辞書を利用しない構造抽出ルールの学習
- 電子書籍の論理構造に基づくポーズ情報の推定とSSML構造化
- 電子書籍の論理構造に基づくポーズ情報の推定とSSML構造化