関係データベースを用いたXML情報検索システムの開発
スポンサーリンク
概要
- 論文の詳細を見る
利用者が文書に対して検索を行う際に,検索要求が検索結果文書中のどの部分と関連しているのかが分かることは有用である.たとえば,大量の学術論文の中から,ある話題に関連する章や節などの部分文書のみを拾い読みしたいという要求は高いと考えられる.近年,様々な文書がXMLで構造化されている.XML文書の構造を利用することで部分文書も対象とする検索が可能となる.そのため,XML文書に対する情報検索に関する研究がさかんになってきた.そこで我々はXML文書に対してキーワード集合による検索を行うシステムであるKikori-KSを関発した.キーワード検索は,XML文書のスキーマを知っている必要がなく,XML専用の問合せ言語に対する知識も必要ないため,多くの一般的な利用者が利用可能である.検索結果として入れ子するXML部分文書を単位として用いるため,我々は検索結果提示インタフェースが重要であると考え,今回開発したKikori-KSでは,XML文書検索のための検索結果表示インタフェースを用意した.キーワード検索に必要な情報は関係データベースに格納し,利用者が入力したキーワード集合に対して関連するXML部分文書を取得し,インタフェースを通じて利用者に提示する.我々は大量のXML部分文書を効率的に扱うために,実体化結合ビューを生成して検索の高速化を実現した.広く利用されている関係データベースを用いることで汎用性の高いシステムが構築できる.INEXテストコレクションを利用した実験では,Kikori-KSが実用的な検索速度と比較的高い適合性を持つことを確認した.
- 社団法人情報処理学会の論文
- 2007-06-15
著者
-
吉川 正俊
京都大学情報学研究科
-
吉川 正俊
京都大学大学院情報学研究科
-
清水 敏之
京都大学大学院情報学研究科
-
清水 敏之
京都大学情報学研究科
-
寺田 憲正
名古屋大学情報科学研究科
-
吉川 正俊
京都大学
-
吉川 正俊
京都大学情報学研究科社会情報学専攻
-
Yoshikawa Masatoshi
Information Technology Center Nagoya University
-
寺田 憲正
名古屋大学情報科学研究科:(現)tis株式会社
関連論文
- Folksonomyのタグを用いた自動分類体系構築へ向けて(夏のデータベースワークショップ2007(データ工学,一般))
- Folksonomyのタグを用いた自動分類体系構築へ向けて(クラスタリング・カテゴライズ,夏のデータベースワークショップ2007(データ工学,一般))
- データベースアウトソーシングにおける社会的情報漏洩防止(ポスターセッション,iDBフォーラム2008(招待講演・ポスター英語ディスカッション))
- データベースアウトソーシングにおける問合せ解析からの社会的情報漏洩防止(セッション3a:Data Mining and Enterprise DB)
- D-045 言語横断情報検索におけるWebディレクトリを利用した訳語の曖昧性解消(D.データベース)
- Webディレクトリを言語資源として利用した言語横断情報検索
- Webディレクトリの階層構造を利用した言語横断情報検索
- Exploiting and Combining Multiple Resources for Query Expansion in Cross-Language Information Retrieval
- D-35 ディレクトリ型検索エンジンを利用した言語横断情報検索(情報検索,D.データベース)
- 書換えに基づく最適化のためのXQueryの相対コストモデル(データベース,フォーマルアプローチ論文)
- 子軸経路式の畳み込みによるXQueryの書き換え
- XQueryのソースレベル最適化のための等価変換に関する考察
- XQuery のソースレベル最適化のための等価変換に関する考察
- ユーザからの負担なく構築したプロファイルに基づく適応的Web情報検索(コンテンツ技術,Web情報システム)
- Wikipediaとドメインオントロジーの統合利用による地球科学データ推薦手法(Webインタフェース/Wikipedia,e-Science及びData Intensive Science)
- 地球観測データ統合解析のためのデータ系譜とアノテーションのモデル化(セッション1b:Multimedia and Semantic DB)
- XML情報検索システムの検索結果に対する入れ子を考慮した順序付け(夏のデータベースワークショップ2007(データ工学,一般))
- ロールベースアクセス制御におけるロール分散実装方式とそのICカード運用管理への適用(夏のデータベースワークショップ2007(データ工学,一般))
- XML情報検索システムの検索結果に対する入れ子を考慮した順序付け(情報検索,夏のデータベースワークショップ2007(データ工学,一般))
- ロールベースアクセス制御におけるロール分散実装方式とそのICカード運用管理への適用(データベース技術,夏のデータベースワークショップ2007(データ工学,一般))
- 関係データベースを用いたXML情報検索システムの開発
- XMLデータの管理とストリーム処理に関する技術(データ工学論文)
- 内容と構造を指定したXML文書検索(XML,夏のデータベースワークショップDBWS 2006)
- アクセス履歴を考慮したファイル間の関連度を用いたデスクトップ検索(履歴応用,夏のデータベースワークショップDBWS 2006)
- 内容と構造を指定したXML文書検索(XML)
- アクセス履歴を考慮したファイル間の関連度を用いたデスクトップ検索(履歴応用)
- 教員プロフィールシステムについて
- WWW上の学術情報文書からのメタデータ抽出(デジタルアーカイブの応用,テーマ : 「デジタルアーカイブの活用(応用)」および一般)
- XML木のための動的範囲ラベル付け手法
- XMLのための動的範囲ラベル付け手法 : その評価およびXRelへの適用について
- 更新に強いXML節点数え上げ手法とその管理
- XML木のための更新に強い節点ラベル付け手法
- 検索結果を統合するための関数選択手法(マルチメディア)(夏のデータベースワークショップDBWS2004)
- 検索結果を統合するための関数選択手法(セッション8A : マルチメディア)(夏のデータベースワークショップ : DBWS2004)
- 異種分散環境におけるロールベースアクセス制御の定量的リスク評価
- XML文書検索システムにおける文書内容の統計量を利用した検索対象部分文書の決定(コンテンツ技術, Web情報システム)
- キーワードに基づいた部分文書検索における解答部分文書が持つ性質の分析(Web,XML,文書検索)(データ工学,ディペンダビリティ,一般)
- キーワードに基づいた部分文書検索における解答部分文書が持つ性質の分析(Web,XML,文書検索)(データ工学,ディペンダビリティ,一般)
- キーワードを利用したXML文書検索
- 検索結果を統合するための情報量の概念を考慮したスコア正規化手法
- ハイパリンクで結ばれた隣接ページの内容に基づくWebページのためのTF-IDF法の改良(情報検索・文書分類)
- 多様な地球科学データに対する俯瞰・検索システムの開発 (データ工学)
- 更新に強いXML節点数え上げ手法とその管理
- Wikipediaにおけるキーパーソン抽出による信頼度算出精度および速度の改善
- 整合性の分析のためのWikipediaからの事象データベースの構築
- 時間グラフパターンを用いたWeb解析
- SVO構造を用いた因果関係ネットワーク構築手法について
- XMLデータに対するキーワード検索結果の理解支援
- D-5-6 話し言葉解析に基づく対話データからの情報抽出(D-5. 言語理解とコミュニケーション, 情報・システム1)
- 3ZP-2 因果関係ネットワークの増分的な構築について(情報爆発時代におけるデータマイニング・アルゴリズム,学生セッション,「情報爆発」時代に向けた新IT基盤技術,情報処理学会創立50周年記念(第72回)全国大会)
- 1K-5 地球観測データに対するメタデータ登録システムの構築 : データセットドキュメントメタファを利用したメタデータ登録(情報爆発時代における大規模画像処理システム,一般セッション,「情報爆発」時代に向けた新IT基盤技術,情報処理学会創立50周年記念(第72回)全国大会)
- XML Content Update Using Relative Region Coordinates(Databases)
- Processing XML Queries using rUID in SKEYRUS (データベースシステム研究報告 夏のデータベースワークショップ DBWS2002)
- 文書指向XMLに対する検索に関する研究(研究会推薦博士論文速報)
- A Structural Numbering Scheme for Processing Queries by Structure and Keyword on XML Data(Information Processing Technology for Web Utilization)
- Processing XML Queries using rUID in SKEYRUS
- 大量頻度分布データのための高速探索アルゴリズム
- ダイナミックタイムワーピングのための類似探索手法
- Translating with Scarce Resources in Cross-Language Information Retrieval: A case Study on Japanese-English
- D-34 Combining Multiple Knowledge Sources for an Efficient Query Expansion in Cross-Language Information Retrieval
- RJ-010 タグクラウドにおける感情の合図(J分野:ヒューマンコミュニケーション&インタラクション,査読付き論文)
- 経路式に基づくRDFデータの関係データベースへの格納と検索(XMLデータベース, データ工学論文)
- 接尾辞配列に基づいたRDFデータのための索引手法
- DIASにおける多分野研究者連携による地球科学データ公開に向けた協働 (データ工学)
- WWW上の学術情報文書からのメタデータ抽出(デジタルアーカイブの応用,テーマ : 「デジタルアーカイブの活用(応用)」および一般)
- 言語横断情報検索における複数の手法による問合せ拡張の適用
- 言語横断情報検索における複数の手法による問合せ拡張の適用
- D-014 Steiner Treeを利用したWikipediaにおける関係の抽出(データベース,一般論文)
- 放送暗号とクラスタリングを用いたデータ共有型Web アプリケーションにおけるプライバシ保護
- XML情報検索における利得と閲覧コストに基づく検索結果の取得と評価
- A-7-3 タイムスタンプによる長期化署名について(A-7.情報セキュリティ,一般講演)
- 編集にあたって
- 特集「情報融合」に向けて
- 編集にあたって
- 編集にあたって
- 編集にあたって
- 編集にあたって
- 特集「情報融合」に向けて
- 編集にあたって
- センターのIT相談と Q&A SYSTEMについて
- <発表論文>判例コーパスを用いた判決文の要約手法 (「ディジタル図書館」ワークショップ 第28回)
- アンカーテキストを用いたWebディレクトリの構築(情報抽出・可視化)
- アンカーテキストを用いたWebディレクトリの構築(情報抽出・可視化)
- XMLデータベース技術概説(XMLデータベース)
- ウェアラブルコンピューティング環境におけるMPEG-7出版を利用した映像検索システム
- 異種分散環境におけるロールベースアクセス制御のモデル駆動設計手法
- 検索結果を統合するための関数選択手法
- 携帯端末のためのキャッシュ方式(セッション5A : キャッシ・データ配信)
- 携帯端末におけるキャッシュ方式(キャッシュ・データ配信)(「夏のデータベースワークショップ(DBWS2003)」一般)
- 特集にあたって(XMLデータベース)
- D-037 経路式に基づくRDFデータのための索引手法とその構築法(D.データベース)
- DIASにおける多分野研究者連携による地球科学データ公開に向けた協働(e-ScienceとData Intensive Science,e-ScienceとData Intensive Science及び一般)
- 多様な地球科学データに対する俯瞰・検索システムの開発(e-ScienceとData Intensive Science,e-ScienceとData Intensive Science及び一般)
- インスタント質問文検索システムの提案(テーマセッション,大規模マルチメディアデータを対象とした次世代検索およびマイニング)
- インスタント質問文検索システムの提案(テーマセッション,大規模マルチメディアデータを対象とした次世代検索およびマイニング)
- 隠れマルコフモデルに基づくストリーム処理 (データベース Vol.4 No.4)
- 整合性を考慮した注釈伝播
- 大規模Webクリックデータのためのイベント予測
- 異種分散環境におけるロールベースアクセス制御のモデル駆動設計手法
- 異種分散環境におけるロールベースアクセス制御の定量的リスク評価