ハイブリッド型文書検索システムの試作と性能評価(テキスト検索,夏のデータベースワークショップ2007(データ工学,一般))
スポンサーリンク
概要
- 論文の詳細を見る
企業内に蓄積された大量業務情報の有効活用を目的として,大規模高度検索技術へのニーズが高まっている.検索処理の大規模化および高度化に対しては,高速な絞込み検索が得意なインデクス型検索と高度な検索が得意なスキャン型検索を組合せたハイブリッド型のアプローチが有効である.本稿では,ハイブリッド型検索の実応用での性能特性確認のため,ハイブリッド型を採用した文書検索プロトタイプを開発し,両検索方式の性能特性に応じて適切な処理分担を行う検索式変換法の検討を行った.その結果,実検索履歴に基づく特許検索ベンチマークにおいて,ハイブリッド型検索の有効性を確認するとともに,性能特性に応じた検索式変換により最悪検索時間を3割強,平均検索時間を2割強さらに削減できる見通しを得た.
- 社団法人電子情報通信学会の論文
- 2007-06-25
著者
-
牛嶋 一智
(株)日立製作所 中央研究所
-
岩山 真
株式会社日立製作所中央研究所
-
安田 知弘
株式会社日立製作所中央研究所
-
牛嶋 一智
株式会社日立製作所中央研究所
-
今一 修
株式会社日立製作所中央研究所
-
今一 修
株式会社日立製作所
関連論文
- 論文と特許を対象にした技術動向分析 第7回,第8回NTCIRワークショップ 特許マイニングタスク
- 対話的文書検索における文書クラスタリングの役割
- 情報のメタデータに着目した情報ライフサイクル管理向けポリシー記述方式
- 情報ライフサイクル管理のためのポリシー記述方式とその解釈実行方式
- 対話的文書検索における文書クラスタリングの役割
- 一般語との曖昧性を持つタンパク質名の自動検出(情報抽出・単語分類)(テーマ:「Webマイニングによる情報活動と自然言語処理」その他一般)
- 一般語との曖昧性を持つタンパク質名の自動検出(情報抽出・単語分類)(テーマ:「Webマイニングによる情報活用と自然言語処理」その他一般)
- D-016 無共有型DBMS向けデータ領域リマッピング機能の開発(D.データベース)
- 3C-2 転置インデックスに位置情報を付与する新手法(情報検索,一般セッション,データベースとメディア)
- 未知の文字列集合を、それらを連結した文字列から推測する線形時間アルゴリズム
- ハイブリッド型文書検索システムの試作と性能評価(夏のデータベースワークショップ2007(データ工学,一般))
- ハイブリッド型文書検索システムの試作と性能評価(テキスト検索,夏のデータベースワークショップ2007(データ工学,一般))
- AAAI90
- 情報の価値に応じた印刷制御機能の開発
- 統計情報と文法制約を統合した統語解析手法
- 係り受け情報を利用したパーザの効率化とロバスト解析への応用
- TD-1-6 DualNAVIによる連想的テキストアクセス
- 類似例の存在を否定的な要因として用いる重要バイグラムの収集支援方法
- 汎用連想計算エンジン GETA とそれに基づく連想検索システム
- 手がかり句を用いた特許請求項の構造解析(自然言語)
- ローカルアラインメントを用いたテキスト間の柔軟な対応付け
- 手がかり句を用いた特許請求項の修辞構造解析
- 手がかり句を用いた特許請求項の修辞構造解析
- 語彙的結束性に基づく語彙的連鎖の計算
- 語彙的連鎖に基づくパッセージ検索
- 語彙的連鎖に基づくパッセージ検索
- 語彙的連鎖に基づくパッセージ検索
- 複数の知識源を統合的に用いた頑健な自然言語処理 (人工知能分野における博士論文)
- 文法的不適格文処理のための統合的枠組み
- コストと報酬の関係に基づく自然な発話の解析
- Chomsky, N. : A Minimalist Program for Linguistic Theory, The View from Building 20, K. Hale and S. J. Keyser (eds.), chapt.1, pp.1-52, The MIT Press (1993).
- 少数の原理に基づく頑健な自然言語処理
- 頑健な自然言語処理の研究動向と課題
- 文字コード処理方式による高速な印刷コントロール機能の開発