情報フィルタリングのためのブール式と文書構造を利用した検索条件生成と検索精度評価
スポンサーリンク
概要
- 論文の詳細を見る
本論文では, ブール式および見出し・文・段落などの文書構造を利用した情報フィルタリングのための検索条件生成実験について報告する.検索精度評価には, テストコレクションBMIR-J1およびこれを拡張したものを用いる.第1の実験では, 実際の情報フィルタリングサービスにおいて検索条件の作成経験を持つ人間が, テストコレクションの検索要求および補足説明文を読んで検索条件を作成する.第2の実験では, 人手による検索条件作成の負荷を軽減するために, 検索要求から検索語を抽出し, 検索条件の自動生成を行う.自動生成実験では, 効率重視の観点からブール式を用いる場合と, 精度重視の観点からブール式を用いない場合の2通りを検討し, いずれの場合にも, 文書構造を利用した検索条件がフラットな検索条件に比べて有効であることを示す.特に, ブール式を用いずに自動生成した検索条件では, ブール式を用いて人手で作成した検索条件とほぼ同程度の高い検索精度が実現できる.また, 人手および自動で検索される正解記事集合が相補的であることを示す.
- 社団法人情報処理学会の論文
- 1998-11-15
著者
-
酒井 哲也
株式会社東芝研究開発センター
-
酒井 哲也
(株)ニューズウォッチ
-
梶浦 正浩
株式会社東芝研究開発センター
-
住田 一男
株式会社東芝研究開発センター
-
梶浦 正浩
(株)ニューズウォッチ
-
酒井 哲也
(株)東芝研究開発センター知識メディアラボラトリー
-
梶浦 正浩
(株)東芝研究開発センターヒューマンインターフェースラボラトリー
関連論文
- 高精度な音声入力質問応答のための疑問表現補完(音声質問応答,インタラクションの理解とデザイン)
- 効率的な番組視聴を支援するための話題ラベルの生成とその評価(セッション2:情報のラベリングと知識の獲得,学生チャレンジ特集)
- 質問応答システムの正解順位とユーザ満足率の関係について(言い換え・質問応答)
- 固有表現抽出と回答タイプ体系が質問応答システムの性能に与える影響(自然言語処理)
- 質問応答型検索の音声認識誤りに対するロバスト性向上(質問応答・応用)
- 質問応答型検索の音声認識誤りに対するロバスト性向上
- 質問応答と,日本語固有表現抽出および固有表現体系の関係についての考察(抽出)
- 質問応答技術に基づくマルチモーダルヘルプシステム(知識の蓄積と活用)(ユビキタス社会における情報流通および一般)
- LD-8 意味役割解析に基づく高適合英語文書の検索(D. データベース)
- 機械翻訳を用いた英日・日英言語横断検索に関する一考察
- 日本語情報検索システム評価用テストコレクションの構築
- 確率モデルに基づく日本語情報フィルタリングにおけるフィードバックによる検索条件展開および検索精度評価
- Cross-language情報検索のためのBMIR-J2を用いた一考察
- 情報フィルタリングのためのブール式と文書構造を利用した検索条件生成と検索精度評価
- 日本語情報検索システム評価用テストコレクション BMIR-J2
- 情報フィルタリングシステムNEATのための検索要求文からのプロファイル生成
- ベンチマーク BMIR-J1 を用いた情報フィルタリングシステム NEAT の評価
- 情報フィルタリングシステム NEAT の開発
- 電子図書館のための効率的な文書検索 : 検索/提示のための文書構造化と抄録生成
- 自動抄録機能をもつ対話的文書検索システム : システムの機能と構成
- 趣味と仕事(平成19年度論文賞の受賞論文紹介)
- チュートリアル: 情報検索テストコレクションと評価指標
- LD-003 Evaluating the Task of Finding One Relevant Document Using Incomplete Relevance Data
- Q,Rの次はO,そしてP...(平成18年度論文賞の受賞論文紹介)
- コモンHIサービス環境の開発
- 情報フィルタリングシステムNEATのための検索要求文からのプロファイル生成
- 効率的な番組視聴を支援するための話題ラベルの生成とその評価(セッション2:情報のラベリングと知識の獲得,学生チャレンジ特集)
- 質問応答システムの正解順位とユーザ満足率の関係について(言い換え・質問応答)
- 人名と番組名の言い換えに対応する音声認識インタフェース
- 2U-3 クライアントマシンの自動設定・修復を行うヘルプデスクシステム : その2 : パッケージ化されたファイル群の差分転送方式
- 2U-2 クライアントマシンの自動設定・修復を行うヘルプデスクシステム : その1 : エンドユーザサポートに応用した場合の効果の検証
- 新聞記事からの用語定義の抽出と固有表現クラスに基づく分類(情報抽出・単語分類)(テーマ:「Webマイニングによる情報活動と自然言語処理」その他一般)
- 新聞記事からの用語定義の抽出と固有表現クラスに基づく分類(情報抽出・単語分類)(テーマ:「Webマイニングによる情報活用と自然言語処理」その他一般)
- ウィキペディアを活用した探検型検索サイトのクエリログ分析(検索・対話)
- ウィキペディアを活用した探検型検索サイトのクエリログ分析(検索・対話)
- ウィキペディアを活用した探検型検索サイトのクエリログ分析 (情報学基礎・自然言語処理)
- RD-001 クリックスルーに基づく探検型検索サイトの設計と開発(データベース,査読付き論文)
- N-008 教学支援システムに関する学生アンケートの分析(N分野:教育・人文科学)
- N-021 自然言語表現に基づく学生アンケート分析システム(N.教育・人文科学)
- 係り受け木を用いた日本語文書の重要部分抽出(要約)
- 係り受け木を用いた日本語文書の重要部分抽出(言語理解とコミュニケーション)
- AI:過去・現在・未来
- 編集にあたって(「実世界に近づくインタフェース技術」)
- 電子流通実装基盤SPAgent
- 電子流通実装基盤SPAgent
- 文書構造解析に基づく自動抄録生成と検索提示機能としての評価
- 文書構造に基づく自動抄録生成
- 自動抄録機能をもつ対話的文書検索システム : 自動抄録機能
- 自動抄録機能をもつ対話的文書検索システム : 検索機能
- 対話的文書検索のための文書構造解析
- 文書の構造解析に基づく文書情報検索
- 日本語論説文自動抄録システムの試作と評価
- 日本語論説文の自動抄録のための文脈構造解析
- I-003 応用規格に基づいたXML文書への変換を可能とする紙文書を対象とした階層的文書変換システム(I分野:画像認識・メディア理解)
- XML文書変換を目的としたセル分類およびセル変形に基づく表構造解析(文書・文字メディアの認識・理解, 一般)
- XML文書変換を目的としたセル分類およびセル変形に基づく表構造解析(文書・文字メディアの認識・理解, 一般)
- XML文書変換を目的としたセル分類およびセル変形に基づく表構造解析
- XML文書変換を目的としたセル分類およびセル変形に基づく表構造解析
- 表層表現抽出と文書構造解析に基づくXML文書変換システム(セッション1 : Web文書生成・管理)
- WWWにおける情報検索技術の動向
- よりよい検索システム実現のために : 正解の良し悪しを考慮した情報検索評価の動向
- The Atmosphere of AIRS : 情報検索の新しい国際会議の紹介
- レレバンスフィードバック
- WWWを対象にした情報フィルタリングサービス
- WWW情報フィルタリング・検索システム : FreshEye : 全体システムの構成と動作
- WWW情報フィルタリング・検索システム : FreshEye : サービス概要
- Learning formal languages from Feasible Teachers
- 知的情報検索の動向
- 文の意味役割解析に基づく全文検索
- 文の意味解析に基づく全文検索
- 対話的抄録生成機能を持つ文書検索システム
- LD_007 NTCIR公式結果に基づく文書検索技術の進歩に関する一考察(D分野:データベース)
- LD-002 ひとつの高適合文書を高精度に検索するタスクのための評価指標(D分野:データベース)
- 日中英3言語6方向音声翻訳システム(翻訳・要約)
- 日中英3言語6方向音声翻訳システム(翻訳・要約)
- マルチデータベース日本語インタフェースの試作 : 問合せの生成・実行
- マルチデータベース日本語インタフェースの試作 : 日本語入力文解析処理
- チュートリアル: 情報検索テストコレクションと評価指標