n-gram型大規模全文検索方式の開発 : 文字種適応型n-gramインデクス方式
スポンサーリンク
概要
- 論文の詳細を見る
電子化文書情報が急激な勢いで増加するに従い、大量の文書情報の中から所望の文書を迅速に探す検索システムへのニーズが高まってきている[1]。これに応えるため、登録文書のテキストからn文字の連続する文字列(以下,n-gramと呼ぶ)を抽出し、そのインデクスを参照して全文検索を行うn-gramインデクス方式の検討を行ってきた[2]。本稿では,n-gramインデクス方式において、総インデクス容量を削減するために開発した、抽出n-gramの種類を抑制する文字種適応型n-gram抽出方式と、インデクス情報としての文書識別子とn-gram出現位置を可変長形式で格納する可変長インデクス方式について報告する。
- 一般社団法人情報処理学会の論文
- 1996-09-04
著者
-
多田 勝己
(株)日立製作所情報通信開発本部
-
畠山 敦
(株)日立製作所情報通信開発本部
-
川口 久光
(株)日立製作所情報通信開発本部
-
加藤 寛次
(株)日立製作所情報通信開発本部
-
畠山 敦
(株)日立製作所 情報・通信開発本部
-
菅谷 奈津子
(株)日立製作所 情報・通信開発本部
-
加藤 寛次
(株)日立製作所情報・通信開発本部
-
多田 勝己
(株)日立製作所システム開発本部
-
菅谷 奈津子
(株)日立製作所システム開発本部
-
加藤 寛次
(株)日立製作所
-
川口 久光
(株)日立製作所 情報・通信開発本部
関連論文
- 文字成分表を用いた大規模全文検索方式の開発 : ハッシュレス文字成分表の高精度化方式
- 文字成分表を用いた大規模全文検索方式の開発 : ハッシュレス文字成分表の構成方式
- RAlD型ファイルシステムVAFS/HRの性能評価
- RAID型ファイルシステムVAFS/HRの障害回復方式
- RAlD型ファイルシステムVAFS/HRのファイルアクセス制御方式
- RAlD型ファイルシステムVAPS/HRのパリティ生成方式
- RAlD型ファイルシステムVAFS/HRのファイル管理方式
- RAID型ファイルシステムVAFS/HRの構想
- 高速UNIXファイルシステムの性能評価
- 高速UNIXファイルシステムの開発における多重アクセス制御方式の実現
- 高速UNIXファイルシステムの開発における非同期I/O制御方式の実現
- 高速UNIXファイルシステムの開発におけるインタフェース仮想化方式の実現
- 高速UNIXファイルシステムの基本構想
- ストライプド高速UNIXファイルシステムの開発 : バーチャルアレイ・ファイルシステム(VAFS)
- バーチャルアレイ・ファイルシステム(vafs)の基本構想
- n-gram型大規模全文検索方式の開発 : 文字種適応型n-gramインデクス方式
- n-gram型大規模全文検索方式の開発 : インクリメンタル型n-gramインデクス方式
- RAID型ファイルシステムVAFS/HRの開発
- フルテキストサーチ用フィルタリング型高速文字列照合方式
- フルテキストサーチシステムBibliotheca/TSの開発(3) : ユーザインタフェース
- フルテキストサーチシステムBibliotheca/TSの開発(2) : サーチアルゴリズム
- フルテキストサーチシステムBirliotheca/TSの開発(1) : システムの概要
- 文書検索向き数値検索方式の提案
- 高速先頭照合方式によるストリングサーチ高速化の検討
- 自由語検索のための高速文字列検索方式
- 自由語検索のための同義語・異表記展開方式
- 自由語による全文検索のためのテキストサーチマシンTSM-I
- 5P-10 知識指向文書管理基盤の開発(4) : ORDB向け構造化文書全文検索プラグイン
- 構造化文書対応全文検索システムBibliotheca2 TextSearchの開発 (4) : 検索機能および検索性能
- 構造化文書対応全文検索システムBibliotheca2 TextSearchの開発 (3) : 構造指定全文検索方式
- 構造化文書対応全文検索システムBibliotheca2 TextSearchの開発 (2) : 構造化文書処理方式
- 構造化文書対応全文検索システムBibliotheca2 TextSearchの開発 (1) : システムの概要
- 大規模ユーザ向け情報クリッピングシステム
- 知的ファイリングモデルシステムの開発(その1) : システムの設計思想と実現方法
- 文書ブラウジングにおけるヒューマンインターフェース
- 知的ファイリングモデルシステムの開発(その4) : 検索効率向上のためのイメージ表示方法
- 知的ファイリングモデルシステムの開発(その2) : 自由語検索における異表記、異表現解消法
- 知識工学の必要性
- 概念ネットワ-クを用いた知的ファイリングシステム (知識工学の情報処理分野への応用)
- 5P-11 知識指向文書管理基盤の開発(5) : n-gram方式に基づく概念検索
- 知的ファイリングシステムのビジュアルインタフェース