二つのトライを用いた自然言語辞書検索技法
スポンサーリンク
概要
- 論文の詳細を見る
トライ構造は自然言語辞雷の検索を中心としてよく用いられているが,キーの数が多くなると状態数の増加に伴う記憶量の増加が問題となる.これに対し,トライの共通接尾辞を併合したDAWGが提案され,この問題を解決しているが,このDAWGではキーに対するレコード情報が一意に決定できない.そのため,その応用はレコー ド情報を必要としない分野(プログラミング言語処理系の指定語の検索,スペルチェックにおける一般辞書など)に限られていた.またDAWGは静的なキー集合を対象としていたので,青江らはDAWGの動的な構成法を提案している.DAWG以外のトライの圧縮手法として,Kurtの手法が存在するが,静的キー集合のみを対象としていた.そこで,本稿ではレコード情報が一意に決定でき,しかも動的キー集合に適用可能なトライの圧縮法を実現するために,二つのトライを利用した新しい構造ダブルトライ(double-trie)を導入し,種々のキー集合に対する実験結果により,提案手法の有効性を実証する.
- 一般社団法人情報処理学会の論文
- 1992-09-28
著者
関連論文
- 各個人のプロファイルを用いたメイル文書のフィルタリング手法
- 分野連想語の出現位置に基づく話題分野の特定手法
- 転置ファイルによる大規模 n-gram データの検索システム
- 転置ファイルによる大規模 n-gram データの検索システム
- 文書レイアウトにおける自動図表配置手法
- ストリングパターンマッチングマシンにおける検索キー追加方法
- LRパーサを用いた文字列置換アルゴリズム
- 拡張ハッシュ法による検索技法の拡張 : 部分文字列検索と順検索への拡張
- HTML形式の表構造に対する一索引化手法
- 定型表現を利用した効率的な形態素解析の実現
- 二つのトライを用いた辞書検索アルゴリズム
- 二つのトライを用いた自然言語辞書検索技法
- トライ構造における共通接尾辞の圧縮アルゴリズム
- 知識表現モデルMERMにおける心理現象の一表現法
- ダブル配列による有限状態機械の記憶アルゴリズム
- 分類知識表現を用いたキー検索アルゴリズムの決定法
- 拡張ハッシングにおけるディレクトリの圧縮アルゴリズム