圧縮テキスト上での文字列照合アルゴリズム
スポンサーリンク
概要
- 論文の詳細を見る
テキスト文字列の中から目的とするパタン文字列の出現を検出するという文字列照合問題は, 情報検索の最も基本的な問題として, 効率のよいアルゴリズムを求めてこれまでに様々な研究がなされてきた. また, データを効率よく圧縮する技法の開発も, 二次記憶装置や通信コストが極めて高価だった時代から引き続き現在に至るまで盛んに行われている. 今日, ワープロや電子メール等の普及によって, 我々のまわりには機械可読な文書が氾濫している. これらの文書は量が膨大になるため, 圧縮した形で保存し, 必要なときに展開して利用することが一般的になりつつある. しかし, 実際にはこれらの文書の大半は, 眠ったまま二度と利用されない. その理由は, 圧縮された文書ファイル群から必要な文書ファイルを探し出す作業がファイルの展開を伴うため, 非常に手間と時間, 作業領域を要することにある. このため, 庄縮されたテキストを展開せずにパターン照合する技法の研究の必要性が高まっている. したがって, 圧縮されたテキスト (場合によってはパターンも圧縮されて与えられる) を陽に展開することなく, そのまま文字列照合を行うアルゴリズムの研究が, 文字列照合の新たな問題設定として注目され始めている. 本講演では, この分野での我々の研究を中心に, 幾つかの話題を紹介する.
- 社団法人電子情報通信学会の論文
- 1997-03-06
著者
関連論文
- 九州大学における一般情報処理教育支援システムについて
- 質問学習における学習可能性の統一的特徴づけ
- 長さ優先置換による文字列圧縮の線形時間アルゴリズム(文字列アルゴリズム)
- 圧縮されたテキスト上のパターン照合 : データ圧縮とパターン照合の新展開
- 断片パターンマッチングの計算量的困難性と近似アルゴリズムについて
- 平衡直線的プログラムに対するパターン照合アルゴリズム
- 2G-2 圧縮テキストに対する文字列照合のための統一的枠組み
- 2G-1 データ圧縮による文字列照合の高速化
- 1Y-8 重み付き分類規則による保健データからのデータマイニング(情報システムの分析・設計・評価,一般講演,コンピュータと人間社会)
- 圧縮テキスト上での文字列照合アルゴリズム
- LZW圧縮テキストに対する高速文字列照合アルゴリズム
- ALT '94報告