n-gram型大規模全文検索方式の開発 : インクリメンタル型n-gramインデクス方式
スポンサーリンク
概要
- 論文の詳細を見る
パソコン等の普及に伴い、それらによって作成される電子化文書が急増している。また、特許公報も電子化され、全文検索対象のデータベース(DB)は大規模となる一方である。そのため、このような大規模DBを対象とした場合でも、所望の文書を高速に探し出すことができる全文検索システムへのニーズが高まっている。今回、n文字の連続する文字列(n-gram)に対するインデクスを用いて検索を行うn-gramインデクス方式において、検索時間の長大化と総インデクス容量の巨大化という相反する問題点を解決する方法を検討した。その結果、インデクス容量が大きいn-gramのみ、その長さを動的に拡張するインクリメンタル型n-gramインデクス方式を開発することができた。本稿では、その基本方式と評価結果について報告する。
- 一般社団法人情報処理学会の論文
- 1996-09-04
著者
-
多田 勝己
(株)日立製作所情報通信開発本部
-
畠山 敦
(株)日立製作所情報通信開発本部
-
川口 久光
(株)日立製作所情報通信開発本部
-
加藤 寛次
(株)日立製作所情報通信開発本部
-
畠山 敦
(株)日立製作所 情報・通信開発本部
-
菅谷 奈津子
(株)日立製作所 情報・通信開発本部
-
加藤 寛次
(株)日立製作所情報・通信開発本部
-
多田 勝己
(株)日立製作所システム開発本部
-
菅谷 奈津子
(株)日立製作所システム開発本部
-
加藤 寛次
(株)日立製作所
-
川口 久光
(株)日立製作所 情報・通信開発本部
関連論文
- 文字成分表を用いた大規模全文検索方式の開発 : ハッシュレス文字成分表の高精度化方式
- 文字成分表を用いた大規模全文検索方式の開発 : ハッシュレス文字成分表の構成方式
- RAlD型ファイルシステムVAFS/HRの性能評価
- RAID型ファイルシステムVAFS/HRの障害回復方式
- RAlD型ファイルシステムVAFS/HRのファイルアクセス制御方式
- RAlD型ファイルシステムVAPS/HRのパリティ生成方式
- RAlD型ファイルシステムVAFS/HRのファイル管理方式
- RAID型ファイルシステムVAFS/HRの構想
- 高速UNIXファイルシステムの性能評価
- 高速UNIXファイルシステムの開発における多重アクセス制御方式の実現
- 高速UNIXファイルシステムの開発における非同期I/O制御方式の実現
- 高速UNIXファイルシステムの開発におけるインタフェース仮想化方式の実現
- 高速UNIXファイルシステムの基本構想
- ストライプド高速UNIXファイルシステムの開発 : バーチャルアレイ・ファイルシステム(VAFS)
- バーチャルアレイ・ファイルシステム(vafs)の基本構想
- n-gram型大規模全文検索方式の開発 : 文字種適応型n-gramインデクス方式
- n-gram型大規模全文検索方式の開発 : インクリメンタル型n-gramインデクス方式
- RAID型ファイルシステムVAFS/HRの開発
- フルテキストサーチ用フィルタリング型高速文字列照合方式
- フルテキストサーチシステムBibliotheca/TSの開発(3) : ユーザインタフェース
- フルテキストサーチシステムBibliotheca/TSの開発(2) : サーチアルゴリズム
- フルテキストサーチシステムBirliotheca/TSの開発(1) : システムの概要
- 文書検索向き数値検索方式の提案
- 高速先頭照合方式によるストリングサーチ高速化の検討
- 自由語検索のための高速文字列検索方式
- 自由語検索のための同義語・異表記展開方式
- 自由語による全文検索のためのテキストサーチマシンTSM-I
- 5P-10 知識指向文書管理基盤の開発(4) : ORDB向け構造化文書全文検索プラグイン
- 構造化文書対応全文検索システムBibliotheca2 TextSearchの開発 (4) : 検索機能および検索性能
- 構造化文書対応全文検索システムBibliotheca2 TextSearchの開発 (3) : 構造指定全文検索方式
- 構造化文書対応全文検索システムBibliotheca2 TextSearchの開発 (2) : 構造化文書処理方式
- 構造化文書対応全文検索システムBibliotheca2 TextSearchの開発 (1) : システムの概要
- 大規模ユーザ向け情報クリッピングシステム
- 知的ファイリングモデルシステムの開発(その1) : システムの設計思想と実現方法
- 文書ブラウジングにおけるヒューマンインターフェース
- 知的ファイリングモデルシステムの開発(その4) : 検索効率向上のためのイメージ表示方法
- 知的ファイリングモデルシステムの開発(その2) : 自由語検索における異表記、異表現解消法
- 知識工学の必要性
- 概念ネットワ-クを用いた知的ファイリングシステム (知識工学の情報処理分野への応用)
- 5P-11 知識指向文書管理基盤の開発(5) : n-gram方式に基づく概念検索
- 知的ファイリングシステムのビジュアルインタフェース