Webコンテンツの分析に基づくオントロジ構築および属性抽出の試み(オントロジ・抽出(1))(セマンティックウェブと自然言語処理その他一般)
スポンサーリンク
概要
- 論文の詳細を見る
近年,Web上にあるコンテンツの「意味」を取り扱う技術として,セマンティックWebが注目されているが,Web上のコンテンツに「意味」をつけるメタデータの付与は課題になっている.本稿では,HTML文書にメタデータを付与する作業を支援するために,あらかじめ設定されたRDFスキーマに基づいて,メタデータを半自動に付与する方法について述べる,すなわち,抽出したい属性を,クラスとその属性という関係で構成し,ある属性が他のクラスを指し示すというRDF Schemaのクラス・属性の関係で表現する.そして,個々のコンテンツのどの部分が,それらの属性に対応しているのかを抽出する.Webコンテンツでは,個々の属性を表す見出し語がついていないことが多いため,それを考慮して属性抽出を行う.講演会などのイベント情報について属性抽出を行い,その結果,適合率で0.63,再現率で0.56が得られた.これらの指標をともに高めることが今後の課題である.
- 2003-09-29
著者
-
大沼 宏行
沖電気工業株式会社
-
松平 正樹
沖電気工業株式会社
-
渕上 正睦
沖電気工業株式会社研究開発本部
-
森田 幸伯
沖電気工業株式会社研究開発本部
-
森田 幸伯
沖電気工業
-
森田 幸伯
沖電気工業株式会社
-
渕上 正睦
沖電気工業(株)研究開発本部
-
松平 正樹
沖電気工業(株)
関連論文
- 情報家電をより身近にするオントロジー(オントロジーの進化と普及(後編))
- オントロジー工学に基づく情報家電の利用法に関する知識推薦手法 : 知識の更新・変化への適応手法を中心にして(言語処理・オントロジ,情報社会のデザイン;デジタルドキュメントと知的コミュニケーション)
- オントロジー工学に基づく情報家電の利用法に関する知識推薦手法 : 知識の更新・変化への適応手法を中心にして(言語処理・オントロジ,情報社会のデザイン;デジタルドキュメントと知的コミュニケーション)
- Webコンテンツの分析に基づくオントロジ構築および属性抽出の試み(オントロジ・抽出(1))(セマンティックウェブと自然言語処理その他一般)
- Webコンテンツの分析に基づくオントロジ構築および属性抽出の試み
- 情報家電をより身近にするオントロジー
- 自然言語処理関連技術の研究概要
- 情報家電オントロジーの開発とマニュアルにおける利用例(情報提示・連携技術,テーマ:「テクニカルな知識流通・共有におけるドキュメント作成・管理技術,および応用」)
- 情報家電オントロジーの開発(言語資源・文書分析)
- DT-2-4 情報家電オントロジー構築と活用に向けた取組み(2) : 構成と記述ガイドライン(DT-2.身近なところで役に立ち始めたセマンティックWeb,チュートリアル講演,ソサイエティ企画)
- DT-2-3 情報家電オントロジー構築と活用に向けた取組み(1) : 機器接続事例の検索を例として(DT-2.身近なところで役に立ち始めたセマンティックWeb,チュートリアル講演,ソサイエティ企画)
- セマンティックWebの企業内システムへの適用(連載(セマンティックWeb)3)
- F-010 WWWを利用した企業情報比較支援システムの開発(F.人工知能)
- LD-005 文書内の人名の個人特定に関する研究 : 「山田さん問題」の解決手法とその評価(D. データベース)
- Jena-セマンティックWebアプリケーション開発のためのJavaフレームワーク(研究のツールボックス(1))
- セマンティックWebのツール(セマンティックWeb)
- 言語情報処理の枠組みとしてのQUIXOTE
- 演繹オブジェクト指向データベースシステムQuixoteの特徴と実現
- JEIDA機械翻訳システム評価基準(開発者編) : 開発者のための評価項目の作成と検討
- 文書中のキーワードに関する多種多様な情報を収集・整理するシステム--システムの概要と固有表現抽出技術,オントロジー技術 (e社会を支える技術特集) -- (特集記事「欲しい情報を望む形で(サービス/コンテンツ等の充実)」)
- 多段情報フィルタリング方式とその評価
- 電子図書館のための全文検索および情報フィルタリング (先端技術特集)
- 索引の動的ロードによる全文検索方式の高速化
- 疑似語句抽出による大規模日本語全文検索方式
- 疑似語句抽出による大規模日本語全文検索方式
- WWW上の電子新聞に対する情報フィルタリング
- 異種性を考慮した集合に基づくデータモデルに関する一考察
- 91-21 オブジェクト指向データベースのためのA-代数
- 3. オブジェクト指向データベースの技術的諸問題 3.2 オブジェクト指向データベース・プログラミング言語 (オブジェクト指向データベースシステム)
- 拡張項のための重ね合わせ符号を用いた検索方式
- 共起データを用いた単語の意味ネットワークの作成
- 日英機械翻訳システムのための前編集支援ツールの開発 : 開発の目的と概要
- 自然言語処理のための知識辞書および知識推論部について
- 5-6.M2Mを基盤としたコンテクストアウェアネスシステム(5.水平統合型M2M,M2Mサービスを支える情報通信技術)