XML文書に対する構造を指定した全文検索方式の提案
スポンサーリンク
概要
- 論文の詳細を見る
近年,蓄積されたXML文書に対して柔軟に構造を指定できる全文検索システムが必要とされている.本論文は,XML文書に対する構造を指定した全文検索方式を提案する.提案手法は,指定された構造の部分文書検索にはストロングDATAGUIDEおよび範囲ラベルを用い,全文検索にはテキストインデックスを用いる.提案手法では,テキストインデックスを拡張してdgノードIDと範囲ラベルを付与することで不必要な構造ジョインを回避している.これにより,XML文書から検索ワードを含むXML部分文書を柔軟かつ高速に検索することができる.本論文では,提案手法を,柔軟な検索を犠牲にした高速な部分インデックス手法と,検索単語とマッチした全テキストノードをそのまま構造ジョインする単純組合せ手法と比較して評価を行った.評価実験では,部分インデックス手法より9%以下の速度低下で柔軟な検索を実現し,単純組合せ手法より最大1桁以上の高速化を確認できた.
- 一般社団法人情報処理学会の論文
- 2008-09-15
著者
-
山室 雅司
NTTサイバースペース研究所
-
山室 雅司
日本電信電話株式会社NTTサイバースペース研究所
-
江田 毅晴
日本電信電話株式会社サイバースペース研究所
-
榎本 俊文
NTTサイバースペース研究所
-
兵藤 正樹
日本電信電話株式会社NTTサイバースペース研究所
-
榎本 俊文
日本電信電話株式会社NTTサイバースペース研究所
-
山室 雅司
Ntt サイバースペース研
-
山室 雅司
日本電信電話株式会社 サイバースペース研究所
-
江田 毅晴
日本電信電話株式会社NTTサイバースペース研究所
関連論文
- Folksonomyのタグを用いた自動分類体系構築へ向けて(夏のデータベースワークショップ2007(データ工学,一般))
- Folksonomyのタグを用いた自動分類体系構築へ向けて(クラスタリング・カテゴライズ,夏のデータベースワークショップ2007(データ工学,一般))
- ダイナミックタイムワーピング距離に基づくストリーム処理(パターン照合・パターン発見,データ工学論文)
- 電子透かし読取りのためのiアプリ高速コーナ検出アルゴリズム(画像認識, コンピュータビジョン)
- SPIRAL : 隠れマルコフモデルのための高速探索手法(ポスターセッション,iDBフォーラム2008(招待講演・ポスター英語ディスカッション))
- 大量な時系列データストリームの類似検出手法(テーマセッション: 時系列・大規模メディア処理, データ工学とメディア理解との融合)
- 関係XMLデータベース用開発支援ツールの設計と実装(テーマセッション,データ工学とメディア理解との融合)
- XML木のための動的範囲ラベル付け手法
- 隠れマルコフモデルデータベースの高速ゆう度検索(データ工学研究専門委員会推薦論文,空間データベース,データ工学論文)
- TEAM Digital Commons(コンテンツ流通と著作権管理)
- 競合学習を用いたエントロピー最小基準クラスタリング法(一般,First Person Visionのための認識・理解)
- CQ2000-29 / TM2000-27 コールセンタのための情報共有システム : Know-who検索システムの適用
- カメラ付携帯電話機を用いたアナログ画像からの高速電子透かし検出方式(画像・映像処理)
- J-036 カメラ入力画像からのリアルタイム電子透かし検出方式(J.グラフィクス・画像)
- J-035 色空間範囲を考慮した電子透かし埋め込み方法の検討(J.グラフィクス・画像)
- CQ2000-29 / TM2000-27 コールセンタのための情報共有システム : Know-Who検索システムの適用
- 関係XMLデータベース用開発支援ツールの設計と実装(テーマセッション,データ工学とメディア理解との融合)
- フォルダ・プログラミング環境「POLDER」
- XML文書に対する構造を指定した全文検索方式の提案
- D-4-16 pgBoscage : PostgreSQLを用いたXMLDBの実装(D-4. データ工学,一般セッション)
- XMLデータの要約情報を用いた高速なXPath処理方法(問合せ処理,データ工学論文)
- 追記・参照型データ管理システムにおけるPush/Pull混在方式の特性評価(セッション4-C:ストリーミング技術)
- 追記・参照型データ管理システムにおけるPush/Pull混在方式の特性評価(セッション4-C:ストリーミング技術)
- エンティティ中心アプローチによるXMLDB設計手法
- 大量な時系列データストリームの類似検出手法(テーマセッション: 時系列・大規模メディア処理, データ工学とメディア理解との融合)
- KnowWho検索を活用した研究開発情報に関するナレッジマネジメント (特集 NTTグループにおけるナレッジマネジメント)
- TEAM Digital Commons(コンテンツ流通と著作権管理)
- 競合学習を用いたエントロピー最小基準クラスタリング法(一般,First Person Visionのための認識・理解)
- 個人情報保護・活用のための契約方式(社会的課題と情報システム)
- 個人情報保護・活用のための契約方式(社会的課題と情報システム)
- 競合学習を用いたエントロピー最小基準クラスタリング法(一般,First Person Visionのための認識・理解)
- ストリーム型ログデータ蓄積処理向け無停止DB分割方式の提案
- ストリーム型ログデータ蓄積処理向け無停止DB分割方式の提案
- ストリーム型ログデータ蓄積処理向け無停止DB分割方式の提案
- 2者間マッチングにおけるコストベースの最適化手法
- 大量データストリームの類似探索手法
- 大量データストリームの類似探索手法
- SoundCompass : ハミングによる音楽検索システム(音楽情報)
- ハミング検索用音楽データベースの分析 : 部分曲分割方法の改善に向けて
- ハミングを用いた音楽検索システム
- 時間正規化を用いたハミング検索システム
- データベースエンジニアリングへの知識処理技術の適用 (「知識処理応用とデータベース」)
- 分散インデックスアーキテクチャによる複数データソースの同時結合方式の提案(検索と索引技術,モバイルデータベースとGIS及び一般)
- Web/AP/DB三層モデルにおけるアクセス検査の効率化(セッション5 : ユーザ支援)
- Web/AP/DB三層モデルにおけるアクセス検査の効率化(セッション5 : ユーザ支援)
- Web/AP/DB三層モデルにおけるアクセス検査の効率化(セッション5:ユーザ支援)
- ログ検査を目的としたAP/DBログ関連付け機能の実装と評価(知的財産関係,一般)
- ログ検査を目的としたAP/DBログ関連付け機能の実装と評価(知的財産関係,一般)
- 分散データストリーム処理における適応型リソース制御方式の検討(セッションB-2:分散処理)
- 分散データストリーム処理における適応型リソース制御方式の検討(セッションB-2:分散処理)
- 追記・参照型データ管理システムの設計と評価(ネットワークサービス,情報洪水時代のネットワークサービス)
- 分散データストリーム処理アーキテクチャの提案(夏のデータベースワークショップ2007(データ工学,一般))
- 分散データストリーム処理アーキテクチャの提案(ストリーム処理,夏のデータベースワークショップ2007(データ工学,一般))
- XMLストリーム処理 : XPath評価からSVGレンダリングまで(オフィスにおけるデジタルドキュメント/コンテンツ管理技術及び一般)
- XMLストリーム処理 : XPath評価からSVGレンダリングまで(オフィスにおけるデジタルドキュメント/コンテンツ管理技術及び一般)
- 個人情報を保護しつつ活用する方法に関する一方式(個人情報)
- DNS名前空間を利用した情報共有方法の検討 : Metadata Space Service System(セッションB-4)(アクティブネットワーク,IP-VPN,ネットワークセキュリティ,超高速ネットワーク,P2P通信及び一般)
- DNS名前空間を利用した情報共有方法の検討 : Metadata Space Service System(セッションB-4)(アクティブネットワーク,IP-VPN,ネットワークセキュリティ,超高速ネットワーク,P2P通信及び一般)
- DNS名前空間を利用した情報共有方法の検討 : Metadata Space Service System(セッションB-4)(アクティブネットワーク,IP-VPN,ネットワークセキュリティ,超高速ネットワーク,P2P通信及び一般)
- スキーマ統合におけるスキーマ要素間の類似性発見手法
- データ項目名等の意味解析による既存のDB中の実体型抽出アルゴリズム
- コンテンツ視聴により形成される動的なコミュニティにおけるユーザ行動特性の分析
- M-002 利用者の利便性を考慮した匿名権利譲渡方式の提案(M.ネットワーク・モバイルコンピューティング)
- 情報流通過程におけるユーザ種別を考慮した協調フィルタリング方式の検討(情報選択・配信)
- ランプ型閾値秘密分散法における部分情報の復元制御
- ランプ型閾値秘密分散法における部分情報の復元制御
- ネットワーク管理のための情報ビジュアル化
- 多大元特徴ベクトルを用いた画像類似検索エンジン
- 多次元特徴ベクトルを用いた画像類似検索エンジン
- 画像類似検索のための多次元空間インデクス
- 6E-7 分散データストリーム処理における自律Pull制御方式の改善(クラウドと分散処理,一般セッション,ネットワーク,情報処理学会創立50周年記念)
- 6E-6 メディア処理向けクラウド基盤「虹雲」(クラウドと分散処理,一般セッション,ネットワーク,情報処理学会創立50周年記念)
- D-4-5 タグツリーによる個人コンテンツ管理システム(D-4. データ工学,一般セッション)
- ディジタル・アイデンティティの法人論的考察
- ディジタル・アイデンティティの法人論的考察
- データ標準化と概念グラフへの変換を利用したスキーマ統合支援法
- オブジェクト進化を実現するクラスベースのオブジェクト指向データベース設計法
- JAVA/HOT JAVA : ようこそジャバ・ザ・ワールドヘ, 菅野政孝(編), NTTデータ通信Java研究会(著) : JAVA/HOT JAVA : ようこそジャバ・ザ・ワールドへ", カットシステム (1996-02), A5判, 定価1,800円
- データベース概念スキーマ統合支援ツールの検討
- 概念グラフによるスキーマ統合における要素間の類似度計算法
- 動的制約分析によるOODB設計法
- ネットワーク情報ビジュアル化方式の検討
- インスタンスの抽象度の異種性を考慮したスキーマ統合
- 通信網構成データのビジュアル化方式
- Cracow International Workshop on Network Management '93報告
- 管理オブジェクト情報集約機構の構成法
- 類似画像検索方式の改変画像検出への適用
- データ圧縮型多次元空間インデックスVA-TREE
- 大量画像の閲覧を目的とする階層的分類支援機能 : 画像目録の実装と評価
- 近傍検索向け転置ファイル法における外部キー検索と動的データ追加の実装と評価
- 類似検索における複数特徴量間の重みを考慮したデータベースアクセスの最適化
- 画像類似検索における複数特徴量間の重みを考慮したアクセス方法
- ハミングを用いた音楽検索システム
- 虹雲ノート : クラウド上でのメディア処理の連携システム(テーマセッション,大規模マルチメディアデータを対象とした次世代検索およびマイニング)
- 虹雲ノート : クラウド上でのメディア処理の連携システム(テーマセッション,大規模マルチメディアデータを対象とした次世代検索およびマイニング)
- 文書クラスタリングアルゴリズムと基準の比較(テーマセッション,大規模マルチメディアデータを対象とした次世代検索およびマイニング)
- 文書クラスタリングアルゴリズムと基準の比較(テーマセッション,大規模マルチメディアデータを対象とした次世代検索およびマイニング)
- 時間制約を持つ寄り道経路探索システムの実現と評価
- DBスキーマ変更を吸収するXMLDB向けDAO設計パターンの提案
- 制約つきグラフ探索を実現する異種データベース統合技術