文字成分表を用いた大規模全文検索方式の開発 : ハッシュレス文字成分表の高精度化方式
スポンサーリンク
概要
- 論文の詳細を見る
近年,電子化文書の急速な増加にともない大量の文書情報をエンドユーザが簡単に蓄積,検索できる文書検索システムに対する要求が高まりつつある。こうした要求に応えるため,報告者等は文字成分表を用いて検索対象とする文書を絞り込むことにより検索を等価的に高速化する階層型プリサーチ方式を開発してきた。今回,文字成分表だけで検索結果を得ることのできる大規模文書DB用全文検索方式について検討した。その結果,各文字成分に対し文字成分表の1エントリを割り当てるハッシュレス文字成分表方式とともに,ハッシュレス文字成分表の検索精度をさらに向上させる方式として一文字おきに隣接する二文字を成分とするスキップ連接文字成分表方式とカタカナなどの表記のゆらぎを許容する検索(異表記検索)が指定された場合に表記のバリエーションを部分的に展開してから検索を行う部分展開異表記検索方式を開発することができた。本稿では,この方式の概要と実データを用いた評価について報告する。
- 社団法人情報処理学会の論文
- 1995-09-20
著者
-
水谷 奈津子
(株)日立製作所情報通信開発本部
-
多田 勝己
(株)日立製作所情報通信開発本部
-
畠山 敦
(株)日立製作所情報通信開発本部
-
川口 久光
(株)日立製作所情報通信開発本部
-
加藤 寛次
(株)日立製作所情報通信開発本部
-
畠山 敦
(株)日立製作所 情報・通信開発本部
-
加藤 寛次
(株)日立製作所情報・通信開発本部
-
多田 勝己
(株)日立製作所システム開発本部
-
加藤 寛次
(株)日立製作所
-
川口 久光
(株)日立製作所 情報・通信開発本部
関連論文
- 文字成分表を用いた大規模全文検索方式の開発 : ハッシュレス文字成分表の高精度化方式
- 文字成分表を用いた大規模全文検索方式の開発 : ハッシュレス文字成分表の構成方式
- RAlD型ファイルシステムVAFS/HRの性能評価
- RAID型ファイルシステムVAFS/HRの障害回復方式
- RAlD型ファイルシステムVAFS/HRのファイルアクセス制御方式
- RAlD型ファイルシステムVAPS/HRのパリティ生成方式
- RAlD型ファイルシステムVAFS/HRのファイル管理方式
- RAID型ファイルシステムVAFS/HRの構想
- 高速UNIXファイルシステムの性能評価
- 高速UNIXファイルシステムの開発における多重アクセス制御方式の実現
- 高速UNIXファイルシステムの開発における非同期I/O制御方式の実現
- 高速UNIXファイルシステムの開発におけるインタフェース仮想化方式の実現
- 高速UNIXファイルシステムの基本構想
- ストライプド高速UNIXファイルシステムの開発 : バーチャルアレイ・ファイルシステム(VAFS)
- バーチャルアレイ・ファイルシステム(vafs)の基本構想
- n-gram型大規模全文検索方式の開発 : 文字種適応型n-gramインデクス方式
- n-gram型大規模全文検索方式の開発 : インクリメンタル型n-gramインデクス方式
- RAID型ファイルシステムVAFS/HRの開発
- フルテキストサーチ用フィルタリング型高速文字列照合方式
- フルテキストサーチシステムBibliotheca/TSの開発(3) : ユーザインタフェース
- フルテキストサーチシステムBibliotheca/TSの開発(2) : サーチアルゴリズム
- フルテキストサーチシステムBirliotheca/TSの開発(1) : システムの概要
- 文書検索向き数値検索方式の提案
- 高速先頭照合方式によるストリングサーチ高速化の検討
- 自由語検索のための高速文字列検索方式
- 自由語検索のための同義語・異表記展開方式
- 自由語による全文検索のためのテキストサーチマシンTSM-I
- 5P-10 知識指向文書管理基盤の開発(4) : ORDB向け構造化文書全文検索プラグイン
- 構造化文書対応全文検索システムBibliotheca2 TextSearchの開発 (4) : 検索機能および検索性能
- 構造化文書対応全文検索システムBibliotheca2 TextSearchの開発 (3) : 構造指定全文検索方式
- 構造化文書対応全文検索システムBibliotheca2 TextSearchの開発 (2) : 構造化文書処理方式
- 構造化文書対応全文検索システムBibliotheca2 TextSearchの開発 (1) : システムの概要
- 知的ファイリングモデルシステムの開発(その1) : システムの設計思想と実現方法
- 文書ブラウジングにおけるヒューマンインターフェース
- 知的ファイリングモデルシステムの開発(その4) : 検索効率向上のためのイメージ表示方法
- 知的ファイリングモデルシステムの開発(その2) : 自由語検索における異表記、異表現解消法
- 知識工学の必要性
- 概念ネットワ-クを用いた知的ファイリングシステム (知識工学の情報処理分野への応用)
- 5P-11 知識指向文書管理基盤の開発(5) : n-gram方式に基づく概念検索
- 知的ファイリングシステムのビジュアルインタフェース