統合検索システムDAISEnでの検索サイトフォーム分析(情報統合)(「夏のデータベースワークショップ(DBWS2003)」一般)
スポンサーリンク
概要
- 論文の詳細を見る
統合検索システムDAISEnは, WWW上の専門的な検索サイトを動的に統合するメタサーチ自動生成システムである.多数の専門的検索サイトヘの検索を統合することにより,膨大なWWWの情報源に対し効率良く高精度の検索を実現する.統合検索のためには,検索サイト毎に異なる入力形式に対応してクエリを送らなければならない.DAISEnでは,検索ページの解析によりサイト毎の入力形式を獲得している.本論文では,国立国会図書館関西館データベース・ナビゲーション・サービスDnaviに登録された2882件の検索サイトを対象として,フオームの解析及び入力形式の抽出を行った.
- 社団法人電子情報通信学会の論文
- 2003-07-11
著者
-
山田 泰寛
九州大学ユーザーサイエンス機構
-
中藤 哲也
九州大学情報基盤研究開発センター
-
廣川 左千男
九州大学情報基盤研究開発センター
-
野口 正人
九州大学大学院システム情報科学府
-
松永 吉広
九州大学大学院システム情報科学府
-
山田 泰寛
九州大学大学院システム情報科学府
-
中藤 哲也
九州大学情報基盤センター
-
中藤 哲也
九州大学
関連論文
- キーワード連動広告でのキーワード発見手法の提案(夏のデータベースワークショップ2007(データ工学,一般))
- キーワード連動広告でのキーワード発見手法の提案(メタデータ,夏のデータベースワークショップ2007(データ工学,一般))
- WebDBにおける出力レコードのメタデータ自動抽出(セッション2:Web応用)
- D_040 WebDBをコンポーネントとするセマンティック・メタ検索の提案(D分野:データベース)
- マッシュアップを簡単に実現するメタCGIとそのアーキテクチャ(セッション2:Web応用)
- FFTを用いた繰り返しパターン発見手法の提案(セッション5B : パターン抽出)
- Webシラバス情報収集エージェントの試作(ソフトウェアエージェントとその応用論文)
- 国内Webシラバスにおけるレコード抽出に関する一考察 (小特集:「Semantic Webとインテリジェントコンテンツ」および一般) -- (インテリジェントコンテンツの構築(Semantic Web,オントロジー,知識コンテンツ))
- 3次元分散共有仮想空間を媒介とする3次元マルチメディアデータの交換・流通環境
- 統合検索システムDAISEnでの検索サイトフォーム分析(セッション9B : 情報統合)
- 統合検索システムDAISEnでの検索サイトフォーム分析(情報統合)(「夏のデータベースワークショップ(DBWS2003)」一般)
- 部分文字列の数え上げによるブログスパムの検出(マイニングとフィルタリング)
- 部分文字列の数え上げによるブログスパムの検出(マイニングとフィルタリング)
- 英和辞典を用いた単語階層構造の動的構築
- マッシュアップを簡単に実現するメタCGIとそのアーキテクチャ(セッション2:Web応用)
- WebDBのQuery Formにおけるメタデータ自動抽出
- Web データベースにおける入力フォーム情報の自動抽出
- 文書群の局所性と大域性の差を利用したキーワード粒度評価(重要語抽出・検索・文書分類)
- 文書群の局所性と大域性の差を利用したキーワード粒度評価(重要語抽出・検索・文書分類)
- 教員データに対する多面的検索システム(eラーニング2, 夏のデータベースワークショップDBWS2005)
- 教員データに対する多面的検索システム(eラーニング2, 夏のデータベースワークショップ2005)
- FFTを用いた近似文字列照合のスコア計算のための最適な写像
- 不一致を許す文字列照合のためのFFTを用いた確率的アルゴリズムの精度評価
- WebDBにおける出力レコードのメタデータ自動抽出(セッション2:Web応用)
- Webデータベースにおける入力フォーム情報の自動抽出(セッション4: メタデータとWebデータベース応用)
- Webデータベースにおける入力フォーム情報の自動抽出(セッション4: メタデータとWebデータベース応用)
- 部分文字列増幅法による共通パターン発見アルゴリズム
- 交代数を用いた多言語Webテキストからの共通部分特定とラッパーの生成法(データマイニング)
- D-039 検索サイトにおける入力項目と検索結果のフィールド名の対応調査(D.データベース)
- テンプレート発見問題の定式化と部分文字列増幅法を用いたアルゴリズム(文字列アルゴリズム)
- 部分文字列増幅法による共通パタン発見アルゴリズム(パターン認識)
- 半構造化文書に対する木構造と文字列を組合せたラッパーの自動生成法(コーパス構築)(セマンティックウェブと自然言語処理その他一般)
- 文字列の頻度分布による共通パタン発見(パタン発見)(セマンティックウェブと自然言語処理その他一般)
- 文字列の頻度分布による共通パタン発見
- FETを用いた繰り返しパターン発見手法の提案(パターン抽出)(「夏のデータベースワークショップ(DBWS2003)」一般)
- Web上の多言語テキストデータからのラッパー自動生成
- SoftPathを用いた同系統単語抽出方式
- D-6 専門検索サイトの動的統合による次世代検索システムDAISENにおける検索サイトエディタの開発(Web検索(1),D.データベース)
- D-5 検索サイトのための集合演算子の自動推定(Web検索(1),D.データベース)
- n-gram交代数を用いた半構造化データの不要部分削除
- n-gram交代数を用いた半構造化データの不要部分削除
- 近似文字列照合のための効率的なアルゴリズム
- 観光イベントについての「といえば検索」の提案(「コミュニティ上での知識の共有・再利用」及び一般)
- D-037 形式概念を用いた倒産情報の分析システム(D分野:データベース,一般論文)
- WWWからの情報抽出 : Webラッパーの自動構築(WWW上の情報の知的アクセスのためのテキスト処理)
- 部分文字列の頻度分布に基づいた同一テンプレートを持つWebページの自動収集(Webマイニング)(テーマ:「Webマイニングによる情報活動と自然言語処理」その他一般)
- 部分文字列の頻度分布に基づいた同一テンプレートを持つWebページの自動収集(Webマイニング)(テーマ:「Webマイニングによる情報活用と自然言語処理」その他一般)
- 部分文字列の頻度分布に基づいた同一テンプレートを持つWebページの自動収集
- 学会講演データの多面的解析システム (テーマ:特集「ウェブデータの知的処理」および一般)
- 概念の活性値の伝搬・争奪による並列意味解析
- 並列構文解析アルゴリズムの密結合マシン上への実装と評価
- 概念の活性と概念間の結合の強さを用いた並列意味解析
- priority-controlを用いた並列談話処理モデル
- 手掛り語に着目した倒産情報の分析手法の提案(応用,自然言語処理)
- 手掛り語に着目した倒産情報の分析手法の提案(応用,自然言語処理)
- 観光ブログからの地名抽出と曖昧性解消
- SNSと検索エンジンを結合したコミュニティ型探索プラットフォームの提案(「コンテキストを意識した知識の利用」及び一般)
- SNSと検索エンジンを結合したコミュニティ型探索プラットフォームの提案