近似文字列照合による全文検索のための接尾辞配列の高速走査法
スポンサーリンク
概要
- 論文の詳細を見る
近似文字列照合による全文検索では,入力パターンと一定以下の編集距離にある部分テキストすべてをテキストから検索する.近似文字列照合による全文検索は,テキストを接尾辞トライにより索引付けし,それを利用して検索することにより実現できる.しかし,接尾辞トライの占める空間領域は大きいため,接尾辞配列を索引として利用することもある.接尾辞配列を索引として利用する場合には,従来研究では,接尾辞トライ上での探索を接尾辞配列上での2分探索により模擬している.それに対して,本稿では,2分探索ではなく,補助的な配列を用いることにより,高速に,接尾辞トライ上での探索を模擬することができる手法を提案した.さらに,2分探索による方法を利用した場合と提案手法を利用した場合とにおける検索速度を実験的に測定し,提案手法の方が検索速度が速いことを示した.
- 一般社団法人情報処理学会の論文
- 2002-09-15
著者
関連論文
- コーパスに基づくがん用語集合の作成と評価
- 自然言語処理技術を用いた大会プログラム作成支援について
- シリーズ型質問文に対して単純結合法を利用した逓減的加点質問応答システム
- 階層構造データ列の簡易な高速検索アルゴリズム(重要語抽出・検索・文書分類)
- 階層構造データ列の簡易な高速検索アルゴリズム(重要語抽出・検索・文書分類)
- 言語学的考察および機械学習手法に基づく意見分析支援--要求意図を取り出す一手法 (2005年情報学シンポジウム講演論文集--社会システムを支える情報学) -- (セッション5:知識獲得・記述の支援)
- 効率的な語彙獲得のための英文読解教材の作成
- フェイスシートとの関係を利用した自由回答アンケートの分析(解析)
- 新聞記事コーパスでの単語出現特徴を利用した観光イベント情報の検索支援
- フェイスシートとの関係を利用した自由回答アンケートの分析(解析)
- 英文読解のためのコースウェアの作成(教育)(テーマ:「Webマイニングによる情報活動と自然言語処理」その他一般)
- 英文読解のためのコースウェアの作成(教育)(テーマ:「Webマイニングによる情報活用と自然言語処理」その他一般)
- 英語教育のための分野特徴単語の選定尺度の比較
- 自由回答アンケートにおける要求意図判定基準
- 質問応答システムにおける逓減加点法に基づく複数記事情報の利用(質問応答・文書分類・自動収集)
- 英文読解のためのコースウェアの作成
- 複数尺度の統計的統合法とその専門用語抽出への応用(オントロジ・抽出(2))(セマンティックウェブと自然言語処理その他一般)
- 複数尺度の統計的統合法とその専門用語抽出への応用
- 日英新聞の記事および文を対応付けるための高信頼性尺度
- WWW検索における複数検索結果の統合処理とその評価(データベースと感性,デザイン,バイオインフォマティクス,音楽,環境,医学,建築分野との連携)
- 事物間関係の推定における文書内頻度を考慮した補完類似度の性能評価
- 日英対訳コーパスの応用について
- SENSEVAL2J 辞書タスクでのCRLの取り組み : 日本語単語の多義性解消における種々の機械学習手法と素性の比較
- 近似文字列照合による全文検索のための接尾辞配列の高速走査法
- 用例に基づく手法と機械学習モデルの組合せによる訳語選択
- 表層表現に着目した自由回答アンケートの意図に基づく自動分類
- 土俵と取り組み
- テキストコーパスの作成 : RWC, JEIDA, Orchid
- 言語教育・言語学習と知的情報処理研究(第二言語の教育と学習)
- 言語教育・言語学習と知的情報処理研究
- 日英新聞記事の対応付けと精度評価
- 統計的手法による分野非依存のテキスト分割
- 情報検索パッケージの実装