情報検索技術による構造化部分文書の抽出法
スポンサーリンク
概要
- 論文の詳細を見る
構造化文書から, 利用者の問合せに相応しい部分文書を抽出する方法として提案されている手法には, 問合せ言語を利用するデータベース的なアプローチ法と, 情報検索技術を用いる手法がある.しかし, これらの手法によって得られる構造化部分文書の葉ノードであるテキストノードの中には, 利用者の問合せに相応しくないノイズとなるべきものも存在している.本稿では, 検索システムによって検索された構造化部分文書から, こうしたノードを除去する手法を提案し, その有効性を確認した.また, 構造化部分文書の検索精度評価のための手法についても提案し, いくつかの知見を得ることができた.これらの手法が確立すれば, 現在でWWWで利用され始めているXHTML文書から, 利用者の問合せに相応しい部分文書を効果的に検索することが可能となる.
- 2001-07-12
著者
-
波多野 賢治
同志社大学文化情報学部
-
植村 俊亮
奈良先端科学技術大学院大学
-
吉川 正俊
奈良先端科学技術大学院大学 情報科学研究科
-
絹谷 弘子
奈良先端科学技術大学院大学情報科学研究所
-
波多野 賢治
奈良先端科学技術大学院大学情報科学研究科
-
絹谷 弘子
東京大学地球観測データ統融合連携研究機構
-
絹谷 弘子
東京大学地球観測データ統連合連携研究機構
関連論文
- Webディレクトリを用いた2言語オントロジーの構築
- Webディレクトリの階層構造を利用した検索対象文書の分野推定に基づいた言語横断情報検索
- D-045 言語横断情報検索におけるWebディレクトリを利用した訳語の曖昧性解消(D.データベース)
- Webディレクトリを言語資源として利用した言語横断情報検索
- D-35 ディレクトリ型検索エンジンを利用した言語横断情報検索(情報検索,D.データベース)
- オンライン業務プログラムの環境独立処理方式
- 日本語プログラム言語"まほろば"の言語仕様
- 日本語プログラム言語"まほろば"の言語仕様と記述評価
- プログラム言語での多バイト符号系支援時の設計指針
- 日本語プログラム言語"まほろば"の文法と記述評価
- 映像データベースシステムにおける映像演算の実装
- 動画像データベースの格納構造
- 重要なblogger発見を目的としたblogスレッド解析手法
- D-029 遺伝性疾患データベースを利用した関連遺伝子検索システムの開発(D.データベース)
- 効率的なXQuery処理のためのDTMに基づくXMLストレージ(クエリ,夏のデータベースワークショップDBWS 2006)
- 標準プログラム言語の国際化
- 入力要素を保存する集約に基づくビューへの問合せ最適化手法
- オブジェクトリンクを有する構造化文書に対する問合せ
- 大規模XMLデータに対する分散問合せ処理の効率化(XML,テーマ : 「デジタルアーカイブの活用(応用)」および一般)
- XMLストリームに対する時制問合せの一手法(XML,テーマ : 「デジタルアーカイブの活用(応用)」および一般)
- ユーザからの負担なく構築したプロファイルに基づく適応的Web情報検索(コンテンツ技術,Web情報システム)
- 情報探索技術を用いたXML部分文書の探索手法
- 検索結果を統合するための関数選択手法(マルチメディア)(夏のデータベースワークショップDBWS2004)
- 検索結果を統合するための関数選択手法(セッション8A : マルチメディア)(夏のデータベースワークショップ : DBWS2004)
- 大規模XMLデータに対する分散問合せ処理の効率化(XML,テーマ : 「デジタルアーカイブの活用(応用)」および一般)
- XML文書検索システムにおける文書内容の統計量を利用した検索対象部分文書の決定(コンテンツ技術, Web情報システム)
- Prologを使ったRDFデータからのユーザ指定による文書構築(セッション4 : XML・構造化文書の蓄積とアクセス)
- Prologを使ったRDFデータからのユーザ指定による文書構築(セッション4 : XML・構造化文書の蓄積とアクセス)
- 自動化・統合化された Web サービス動的実行システム(情報システム開発の支援環境と手法)(情報システム論文)
- キーワードに基づいた部分文書検索における解答部分文書が持つ性質の分析(Web,XML,文書検索)(データ工学,ディペンダビリティ,一般)
- キーワードに基づいた部分文書検索における解答部分文書が持つ性質の分析(Web,XML,文書検索)(データ工学,ディペンダビリティ,一般)
- M-074 移動端末のためのトポロジ変化に強いクラスタリング手法(M.ネットワーク・モバイルコンピューティング)
- E-006 文書構築のためのツールとしてのProlog(E.自然言語・文書・ゲーム)
- キーワードを利用したXML文書検索
- 移動オブジェクトのクラスタリング手法に関する一提案(知識の蓄積と活用)(ユビキタス社会における情報流通および一般)
- 検索結果を統合するための情報量の概念を考慮したスコア正規化手法
- ハイパリンクで結ばれた隣接ページの内容に基づくWebページのためのTF-IDF法の改良(情報検索・文書分類)
- 複旋律音楽を対象とした楽曲検索システムのためのGTTM適用の検討(音楽検索)
- 6S-8 複数の重みを保持した木構造データに対する類似度算出法の検討(XML・グラフデータベース,学生セッション,データベースとメディア,情報処理学会創立50周年記念)
- 5S-9 複数評価項目を考慮した推薦手法の提案(情報推薦(2),学生セッション,データベースとメディア,情報処理学会創立50周年記念)
- 3Q-4 隣接文書の特徴を考慮した文書特徴付け手法の精度比較(情報抽出,学生セッション,データベースとメディア,情報処理学会創立50周年記念)
- 隣接ページのクエリ尤度を考慮した文書特徴付け手法の実装とその評価
- 索引語の統計量を用いたXML部分文書検索法の組合せ利用とその効果
- 索引語の統計量を用いたXML部分文書検索法の組合せ利用とその効果
- 2.非対称k-medoids法を用いたWikipedia XMLコーパスの分析(特別セッション 非対称データの解析I)
- 3ZA-2 他者の意見を反映した洋服コーディネート推薦システム(情報社会を支える技術(2),学生セッション,コンピュータと人間社会)
- 3ZA-1 ワンルーム型居住空間における家具配置支援システム(情報社会を支える技術(2),学生セッション,コンピュータと人間社会)
- XML情報検索における構造問合せを利用した部分文書スコアリング(DE-2検索とXML文書処理,インターネット環境でのデータ工学とディペンダビリティ,及び一般)
- XML情報検索における構造問合せを利用した部分文書スコアリング(DE-2検索とXML文書処理,インターネット環境でのデータ工学とディペンダビリティ,及び一般)
- XML検索(私のブックマーク)
- XML文書における要素名と文書構造を利用した情報フィルタリング
- 3次元自己組織化マップに基づく文書のブラウジングと検索
- 歴史的文献画像のための電子スクラップブックシステム
- 歴史文献画像に関する注釈の管理と再利用
- Adaptive Web Search Considering User's Ephemeral and Persistent Preferences
- Improvement in TF-IDF scheme for Web Pages and its Retrieval Accuracy
- 部分グラフを基本単位としたWeb文書検索 : 単語の出現密度分布の適用
- 自己組織化マップと検索エンジンを用いたWeb文書の分類ビュー機構
- 自己組織化マップと適合フィードバック機能を用いたWeb文書群の分類ビュー機構について
- 部分グラフを基本単位とするWeb文書群の検索モデルと自動分類について
- 自己組織化のマップを用いたWeb文書の対話的分類とその視覚化
- 多段階自己組織化マップによるビデオ映像記述支援と類似シーン検索(新世代ダータベース技術 : インターネット・マルチメディア・モーバイルを中心として)
- 映像データベースの内容記述へのコンテンツ情報の応用
- 映像自己組織化機構に基づく内容記述と類似シーン検索
- 映像自己組織化機構に基づく内容記述と類似シーン検索
- 映像データベースの動的クラスタリングと素材検索機構について
- 映像データベースの動的クラスタリングと素材検索機構について
- 6ZC-7 XML検索技術を利用した検索結果の構成手法(情報爆発時代におけるWebパーティカル検索,学生セッション,「情報爆発」時代に向けた新IT基盤技術,情報処理学会創立50周年記念(第72回)全国大会)
- ブックマークの階層構造を考慮した協調フィルタリングによるWebページの推薦手法
- ウェアラブルコンピューティングのための追記型ファイルシステムの実装
- ウェアラブルコンピューティングのためのポータブルな能動型DBMSの検討(インターネット環境でのデータ工学とディペンダビィリティ及び一般)
- ウェアラブルコンピューティングのためのポータブルな能動型DBMSの検討(インターネット環境でのデータ工学とディペンダビィリティ及び一般)
- ウェアラブルコンピューティングのためのポータブルな能動型DBMSの検討
- 検索結果を統合するための関数選択手法
- 携帯端末のためのキャッシュ方式(セッション5A : キャッシ・データ配信)
- 携帯端末におけるキャッシュ方式(キャッシュ・データ配信)(「夏のデータベースワークショップ(DBWS2003)」一般)
- XMLデータ群の個人化とその構成最適化について(実空間とサイバースペースの融合 : 感性, データベース, ロボティクスおよび一般)
- 複数のメディアで構成された電子文書の検索手法
- 情報検索支援のためのブックマーク解析手法(セッション9A : Web(1))
- 情報検索支援のためのブックマーク解析手法(Web(1))(「夏のデータベースワークショップ(DBWS2003)」一般)
- キーワードを利用したXML文書検索のための検索結果粒度決定法
- XML文書の文書構造と内容を用いた部分文書の抽出手法
- 情報検索技術による構造化部分文書の抽出法
- 情報検索技術による構造化部分文書の抽出法
- 個人のコンディションや欲求を考慮した献立推薦システムの実装とその評価
- 明示的な嗜好評価を活用した商品推薦システムの実装とその評価
- 逐次的なクエリ拡張のためのサポートベクターマシンの利用
- 木構造類似度算出法のための複数観点の抽出法
- 和歌データの構造化とその格納手法の一考察 (パターン認識・メディア理解)
- 和歌データの構造化とその格納手法の一考察 (データ工学)
- XML情報検索のための動的な索引管理手法の一提案
- 動的な文書構築のための文書部品ファイルの選択・組織化ツール
- 和歌データの構造化とその格納手法の一考察(一般セッション,大規模マルチメディアデータを対象とした次世代検索およびマイニング)
- 和歌データの構造化とその格納手法の一考察(一般セッション,大規模マルチメディアデータを対象とした次世代検索およびマイニング)
- RDFを利用した和歌データの管理に関する提案
- RDFを利用した和歌データの管理に関する提案
- D-5-14 ヒトの文章理解過程を考慮した重要文抽出手法の提案(D-5.言語理解とコミュニケーション,一般セッション)
- D-5-10 形態素出現パタンを用いた体験情報抽出システムの構築(D-5.言語理解とコミュニケーション,一般セッション)
- 文書の更新を考慮した高精度XML部分文書検索手法の提案
- D-9-11 商店街の来客数向上に貢献する情報システムの構築(D-9.ライフインテリジェンスとオフィス情報システム)