数値情報を用いたテキスト検索方式の提案と評価
スポンサーリンク
概要
- 論文の詳細を見る
本論文では, テキスト中から数値情報を抽出し, 単語と組み合わせて検索する方式とその精度評価結果について述べる. テキスト中の数値情報を抽出し登録することで, 数値によるテキスト内容の検索や絞り込みができる. 本方式では, 数値の係り先を特定しなくても, 単語条件との単純な組み合わせで数値条件による絞り込み効果を実現した. 一方, 一般の文章中の数値表現には, 概数表現や範囲表現が含まれており, 表現もさまざまである. 本方式では, 数値を修飾する表現を6種類に分類して, 抽出した数値とともに利用することで検索もれを防ぐようにした. 筆者らが開発した多角的検索システムOTROSに数値情報検索機能を組み込み, BMIR-J2を用いて検索精度を評価した. その結果, 構文解析を使わずに単語とAND演算するだけでも再現率をあまり下げずに適合率を9%から66%向上でき, 本方式の効果を確認できた.
- 一般社団法人情報処理学会の論文
- 1999-03-01
著者
-
福島 俊一
NECヒューマンメディア研究所
-
福島 俊一
Nec情報通信メディア研究本部インターネットシステム研究所
-
山田 洋志
Nec第二システム事業本部オープン共通システム開発部
-
山田 洋志
NECヒューマンメディア研究所
関連論文
- ペン校正支援システム
- Webページの重要度ファクタに関する一考察
- 冗長分散格納によるPCクラスタ上の動的負荷均衡化
- 校正支援システムSt.WORDSの文書検査機能
- 辞書およびパターンマッチルールの増強と品質強化に基づく日本語固有表現抽出
- Webページからのタイプ別情報抽出・分類方式
- Webページからのタイプ別情報抽出・分類方式
- 1N-3 日本語テキストからの固有表現抽出システムの開発と評価
- 2P-2 近接演算による数値情報検索の精度改善
- 1U-3 テキスト中の数値表現を用いた情報検索方式の評価
- 数値情報を用いたテキスト検索方式の提案と評価
- インターネット多角的検索システムOTROS : データベースを用いたクエリ展開方式の提案
- インターネット多角的検索システムOTROS : 数値情報の抽出と検索
- インターネット多角的検索システムOTROS : 全体の概要と構成
- 固有名詞分類属性を利用した情報検索
- 予測ペン入力インタフェースとその手書き操作削減効果
- 予測ペン入力インタフェースとその手書き操作削減効果
- ペンベース文書作成(2) : 予測ペン入力方式
- ペンベース文書作成(1) : 試作システム
- 入力文字列予測表示を導入した日本語文章の入力法
- 自然言語処理を用いたペン入力効率向上手法の提案
- 大語彙かな漢字変換 : 未登録語と区切り誤りの減少
- WWW情報検索技術と評価の問題(情報検索システムの力くらべ : テストコレクションによる評価)
- 4P-9 組合せ情報フィルタ方式の信頼度を用いた精度改良
- 文書タイプ分類による問題解決向きWWW検索システムの開発と評価
- インターネット多角的検索システムOTROS : 構造的特徴量によるタイプ分類と検索
- 日本語全文検索における文字組ベースのランキングの評価
- 文字ベース凝縮テキストによる全文検索方式の評価
- 大規模テキスト並列検索エンジンRetrievalExpress (2) : 構造化テキスト検索方式
- 大語彙辞書を用いたかな漢字変換についての考察