XML文書検索システムにおける文書内容の統計量を利用した検索対象部分文書の決定(コンテンツ技術, Web情報システム)
スポンサーリンク
概要
- 論文の詳細を見る
本論文では,キーワードを利用したXML文書検索において,検索対象となるXML部分文書の性質を統計的に分析し,その分析結果に基づいて解答候補となり得るXML部分文書を決定することで,実用的なXML文書検索システムを構築できることを報告する.実用的なXML文書検索システムを構築する上で重要な点は,検索対象となるXML文書が膨大であればあるほどその部分文書数が肥大化するため,あらかじめ解とはなり得ない部分文書を取り除く,すなわちデータクレンジングすることにある.これまでの提案では,人間の判断でXML部分文書数の肥大化を抑制していたが,本論文の提案によってXML部分文書の性質を特徴量を用いて分析し,極端な特徴量をもつ部分文書を検索対象から除外することで,大量の更には様々な種類のXML文書に対して,実用的な検索システムの構築が可能となる.評価実験の結果,提案手法によって検索速度,検索精度がともに改善されることが判明した.
- 社団法人電子情報通信学会の論文
- 2006-03-01
著者
-
植村 俊亮
奈良産業大学情報学部
-
波多野 賢治
同志社大学文化情報学部
-
吉川 正俊
名古屋大学情報連携基盤センター
-
植村 俊亮
奈良先端科学技術大学院大学情報科学研究科
-
植村 俊亮
奈良先端科学技術大学院大学
-
吉川 正俊
京都大学大学院情報学研究科
-
波多野 賢治
奈良先端科学技術大学院大学情報科学研究科
-
絹谷 弘子
東京大学地球観測データ統融合連携研究機構
-
絹谷 弘子
お茶の水女子大学総合情報処理センター
-
吉川 正俊
京都大学
-
吉川 正俊
京都大学情報学研究科社会情報学専攻
-
Yoshikawa Masatoshi
Information Technology Center Nagoya University
-
絹谷 弘子
東京大学地球観測データ統連合連携研究機構
関連論文
- Webディレクトリを用いた2言語オントロジーの構築
- Webディレクトリの階層構造を利用した検索対象文書の分野推定に基づいた言語横断情報検索
- D-045 言語横断情報検索におけるWebディレクトリを利用した訳語の曖昧性解消(D.データベース)
- Webディレクトリを言語資源として利用した言語横断情報検索
- D-35 ディレクトリ型検索エンジンを利用した言語横断情報検索(情報検索,D.データベース)
- オンライン業務プログラムの環境独立処理方式
- 重要なblogger発見を目的としたblogスレッド解析手法
- ロックフリーGCLOCKページ置換アルゴリズム(ウェブ情報とデータベースに関して(ポスター講演))
- ユーザの時系列コンテキストを考慮した情報推薦方式の提案(セッション4b:Information Retrieval and Recommendation)
- 計算リソースとデータ量にスケーラブルなXMLデータベースシステムの実現(jDBワークショップ)
- ユーザコンテキストを考慮した情報推薦方式に関する研究(jDBワークショップ)
- 文書構造情報を利用したWeb情報検索(セッション3,学生チャレンジ特集)
- 文書構造情報を利用したWeb情報検索(テーマ:学生チャレンジ特集)
- 6J-5 情報爆発時代に向けたコンテキストアウェア情報推薦方式のための特徴パラメタ最適化に関する考察(情報爆発時代における情報検索・推薦技術およびWebコミュニティ分析,一般セッション,「情報爆発」時代に向けた新しいIT基盤技術)
- 3J-2 情報爆発時代における文書構造を考慮した検索システムのユーザインタフェース(情報爆発時代における構造化文書とストレージ技術,一般セッション,「情報爆発」時代に向けた新しいIT基盤技術)
- Remote Proxyを利用した並列分散XML問合せ処理手法の提案(夏のデータベースワークショップ2007(データ工学,一般))
- 情報推薦におけるコンテキスト依存型ランキング方式の提案(夏のデータベースワークショップ2007(データ工学,一般))
- タグ情報を利用したコンテキスト依存型協調フィルタリングに基づくWeb情報推薦(夏のデータベースワークショップ2007(データ工学,一般))
- Remote Proxyを利用した並列分散XML問合せ処理手法の提案(XML (2),夏のデータベースワークショップ2007(データ工学,一般))
- 情報推薦におけるコンテキスト依存型ランキング方式の提案(情報抽出および推薦,夏のデータベースワークショップ2007(データ工学,一般))
- タグ情報を利用したコンテキスト依存型協調フィルタリングに基づくWeb情報推薦(情報推薦・パーソナライズドサーチ,夏のデータベースワークショップ2007(データ工学,一般))
- 状況依存型ユーザ嗜好モデリングに基づくContext-Aware情報推薦システム
- 効率的なXQuery処理のためのDTMに基づくXMLストレージ
- D-029 遺伝性疾患データベースを利用した関連遺伝子検索システムの開発(D.データベース)
- 効率的なXQuery処理のためのDTMに基づくXMLストレージ(クエリ,夏のデータベースワークショップDBWS 2006)
- 大規模XMLデータに対する分散問合せ処理の効率化(XML,テーマ : 「デジタルアーカイブの活用(応用)」および一般)
- XMLストリームに対する時制問合せの一手法(XML,テーマ : 「デジタルアーカイブの活用(応用)」および一般)
- ユーザからの負担なく構築したプロファイルに基づく適応的Web情報検索(コンテンツ技術,Web情報システム)
- XML木のための動的範囲ラベル付け手法
- XMLのための動的範囲ラベル付け手法 : その評価およびXRelへの適用について
- 更新に強いXML節点数え上げ手法とその管理
- 情報探索技術を用いたXML部分文書の探索手法
- 楕円体問合せのための空間変換を用いた類似探索アルゴリズム
- 楕円体問合せのための類似探索手法の提案
- 検索結果を統合するための関数選択手法(マルチメディア)(夏のデータベースワークショップDBWS2004)
- 検索結果を統合するための関数選択手法(セッション8A : マルチメディア)(夏のデータベースワークショップ : DBWS2004)
- 計算リソースとデータ量にスケーラブルなXMLデータベースシステムの実現(jDBワークショップ)
- ユーザコンテキストを考慮した情報推薦方式に関する研究(jDBワークショップ)
- 大規模XMLデータに対する分散問合せ処理の効率化(XML,テーマ : 「デジタルアーカイブの活用(応用)」および一般)
- XML文書検索システムにおける文書内容の統計量を利用した検索対象部分文書の決定(コンテンツ技術, Web情報システム)
- Prologを使ったRDFデータからのユーザ指定による文書構築(セッション4 : XML・構造化文書の蓄積とアクセス)
- Prologを使ったRDFデータからのユーザ指定による文書構築(セッション4 : XML・構造化文書の蓄積とアクセス)
- 自動化・統合化された Web サービス動的実行システム(情報システム開発の支援環境と手法)(情報システム論文)
- キーワードに基づいた部分文書検索における解答部分文書が持つ性質の分析(Web,XML,文書検索)(データ工学,ディペンダビリティ,一般)
- キーワードに基づいた部分文書検索における解答部分文書が持つ性質の分析(Web,XML,文書検索)(データ工学,ディペンダビリティ,一般)
- M-074 移動端末のためのトポロジ変化に強いクラスタリング手法(M.ネットワーク・モバイルコンピューティング)
- E-006 文書構築のためのツールとしてのProlog(E.自然言語・文書・ゲーム)
- キーワードを利用したXML文書検索
- 移動オブジェクトのクラスタリング手法に関する一提案(知識の蓄積と活用)(ユビキタス社会における情報流通および一般)
- 検索結果を統合するための情報量の概念を考慮したスコア正規化手法
- ハイパリンクで結ばれた隣接ページの内容に基づくWebページのためのTF-IDF法の改良(情報検索・文書分類)
- リージョンディレクトリを用いた関係データベースによる大規模XMLデータ処理(XML2)(夏のデータベースワークショップDBWS2004)
- リージョンディレクトリを用いた関係データベースによる大規模XMLデータ処理(セッション4B : XML2)(夏のデータベースワークショップ : DBWS2004)
- ロックフリーGCLOCKページ置換アルゴリズム
- XMLストリームに対する時制問合せの一手法(XML,テーマ : 「デジタルアーカイブの活用(応用)」および一般)
- 更新に強いXML節点数え上げ手法とその管理
- Remote Proxy を利用した分散 XQuery 問合せ処理
- 情報推薦におけるユーザの価値判断基準モデルに基づくコンテキスト依存型ランキング方式
- 誤差を考慮した時系列マイクロアレイデータの時間軸補正方法(セッション6)
- 誤差を考慮した時系列マイクロアレイデータの時間軸補正方法(セッション6)
- 異なる時系列マイクロアレイデータの比較のためのデータ補正方式(Expression analysis)
- 部分圧縮を用いた大規模XMLデータ処理方式の提案(インターネット環境のコンテンツ技術及び一般)
- 自律ディスクによる広域分散ストレージシステムの通信およびストレージのオーバヘッドを考慮した性能評価
- 自律ディスクによる広域分散ストレージシステムの通信およびストレージのオーバヘッドを考慮した性能評価(ストレージ,夏のデータベースワークショップDBWS 2006)
- 自律ディスクによる広域分散ストレージシステムの通信およびストレージのオーバヘッドを考慮した性能評価(ストレージ)
- 自律ディスクによる広域分散ストレージシステムの通信およびストレージのオーバヘッドを考慮した性能評価
- 自律ディスクによる広域分散ストレージシステムの通信およびストレージのオーバヘッドを考慮した性能評価 (夏のデータベースワークショップDBWS 2006)
- 自律ディスクによる広域分散ストレージの静的な性能解析(ストレージ2, 夏のデータベースワークショップDBWS2005)
- 自律ディスクによる広域分散ストレージの静的な性能解析(ストレージ2, 夏のデータベースワークショップ2005)
- 自律ディスクによる広域分散ストレージのデータ移動制御方式(セッション3 : データベース基盤技術)
- 歴史的文献画像のための電子スクラップブックシステム
- 経路式に基づくRDFデータの関係データベースへの格納と検索(XMLデータベース, データ工学論文)
- 接尾辞配列に基づいたRDFデータのための索引手法
- 位置情報と地理情報を用いたウェアラブルカメラ映像のダイジェスト作成
- 位置情報と地理情報を用いたウェアラブルカメラ映像のダイジェスト作成
- 言語横断情報検索における複数の手法による問合せ拡張の適用
- 言語横断情報検索における複数の手法による問合せ拡張の適用
- 効率的なXQuery処理のためのDTMに基づくXMLストレージ(クエリ)
- 効率的な XQuery 処理のためのDTMに基づくXMLストレージ
- D-4-14 自律分析によるXPathの出現頻度抽出とデータ分割(D-4.データ工学,一般講演)
- Charles W. Bachman : The Programmer as Navigator(20世紀の名著名論)
- 5. まとめ : 情報化に対する期待と課題 : 5-1 発掘現場におけるリアルタイムアーカイビングへの期待(いにしえの世界を探る科学技術)
- ウェアラブルコンピューティングのためのポータブルな能動型DBMSの検討(インターネット環境でのデータ工学とディペンダビィリティ及び一般)
- ウェアラブルコンピューティングのためのポータブルな能動型DBMSの検討(インターネット環境でのデータ工学とディペンダビィリティ及び一般)
- ウェアラブルコンピューティングのためのポータブルな能動型DBMSの検討
- 携帯端末のためのキャッシュ方式(セッション5A : キャッシ・データ配信)
- 携帯端末におけるキャッシュ方式(キャッシュ・データ配信)(「夏のデータベースワークショップ(DBWS2003)」一般)
- XMLデータ群の個人化とその構成最適化について(実空間とサイバースペースの融合 : 感性, データベース, ロボティクスおよび一般)
- 複数のメディアで構成された電子文書の検索手法
- D-037 経路式に基づくRDFデータのための索引手法とその構築法(D.データベース)
- 情報検索支援のためのブックマーク解析手法(セッション9A : Web(1))
- 情報検索支援のためのブックマーク解析手法(Web(1))(「夏のデータベースワークショップ(DBWS2003)」一般)
- XML文書の文書構造と内容を用いた部分文書の抽出手法
- マルチメディアデータのための索引技術(マルチメディア時代のデータベース索引技術)
- 情報検索技術による構造化部分文書の抽出法
- XML文書のためのバイテンポラルデータモデル
- 動的な文書構築のための文書部品ファイルの選択・組織化ツール
- D-9-1 プリミティブWebサービスの入出力データに関する一考察(D-9. オフィスインフォメーションシステム, 情報・システム1)
- リージョンディレクトリを用いた関係データベースによる大規模XMLデータ処理
- D-9-5 WSIFにおけるWebサービス・メソッドの自動設定(D-9. オフィスインフォメーションシステム)