ダブル配列を用いたACマシンにおける遷移の分岐別管理による効率的な辞書構造の実現
スポンサーリンク
概要
- 論文の詳細を見る
自然言語処理における辞書構造として,トライ法が広く用いられているが,日本語のように分かち書きされていない言語のテキストからキーワードを検出するためには,解析対象となるテキストのあらゆる位置から探索する必要がある.より高速に形態素解析を行うため,複数のキーワードをテキストから線形時間で検出する AC 法を用いる手法が提案されているが,AC 法はトライ法よりも使用する記憶領域が大きい.本論文では,AC マシンにおける遷移のうち,多分岐の節点における遷移をダブル配列に,1 方向分岐の節点における遷移をダブル配列と異なる配列にそれぞれ定義することで,照合時に必要な記憶領域を抑制し,高速性とコンパクト性をあわせ持つ AC マシンを実現する手法を提案する.日本語形態素 40 万語を登録した実験で,提案手法はトライを用いた辞書システム Darts とほぼ同等の記憶領域で対象テキストを 60〜87% の時間で照合した.
- 2009-06-29
著者
関連論文
- 6X-9 一般順序点と訓読木を導入した訓読アルゴリズムの設計と実装(音声・言語処理,学生セッション,人工知能と認知科学)
- 遷移先関数を拡張した効率的なパターン照合機械の設計と実装(パターン照合・パターン発見,データ工学論文)
- ダブル配列の遷移拡張によるLR構文解析表の実現と解析速度の高速化
- ダブル配列により状態遷移を高速化したLR解析表の実現
- 6W-4 ダブル配列によるGLR解析表の設計(構文解析・生成・学習,学生セッション,人工知能と認知科学,情報処理学会創立50周年記念)
- 6R-6 ダブル配列上のシングル節点に着目した更新法の提案(データベース技術,学生セッション,データベースとメディア,情報処理学会創立50周年記念)
- D-002 ダブル配列による遷移表を用いたLR解析におけるshift・goto操作の高速化(データベース,一般論文)
- RD-001 ダブル配列の遷移集合管理による追加・削除処理の高速化(データベース,査読付き論文)
- ダブル配列により状態遷移を高速化したLR解析表の実現
- ダブル配列を用いたACマシンにおける遷移の分岐別管理による効率的な辞書構造の実現
- D_044 ダブル配列上の一方向分岐に着目した探索手法の提案(D分野:データベース)
- 教育実践という視点を核にした一般情報教育を体系的に学ぶWeb教材の開発とその評価
- ダブル配列上の遷移数を抑制した基数探索法の提案(セッション3:情報検索と情報ハイディング,学生チャレンジ特集)
- ダブル配列上の遷移数を抑制した基数探索法の提案(セッション3:情報検索と情報ハイディング,学生チャレンジ特集)
- ダブル配列により状態遷移を高速化したLR解析表の実現 (言語理解とコミュニケーション)
- ダブル配列を用いた AC 法の効率的なパターン照合
- D-032 複数パターンを高速に照合する遷移関数の実現(データベース,一般論文)
- D-029 ダブル配列における一方向分岐の遷移あたりに要する計算量の抑制(データベース,一般論文)
- D-028 遷移先節点集合の管理によるダブル配列の更新手法(データベース,一般論文)
- 4P-6 ClamAVのAC法をダブル配列により拡張したアンチウイルスエンジンの提案(アルゴリズムとその応用,学生セッション,ソフトウェア科学・工学)
- 4P-5 複数パターンマッチングマシンにおける遷移先決定関数の最適化(アルゴリズムとその応用,学生セッション,ソフトウェア科学・工学)
- D-017 パトリシアを多分木に拡張したデータ構造の構築方法(D分野:データベース)
- D-016 ダブル配列を用いたAC法の照合アルゴリズム(D分野:データベース)
- ダブル配列によるパトリシアを拡張した基数探索法
- 圧縮ディジタル探索木における辞書情報更新の高速化手法
- 遷移先節点集合を導入したトライ構造における更新手法の実現(データ構造,テーマ : 「デジタルアーカイブの活用(応用)」および一般)
- 遷移先節点集合を導入したトライ構造における更新手法の実現(データ構造,テーマ : 「デジタルアーカイブの活用(応用)」および一般)
- 自然言語処理における効果的な辞書情報更新アルゴリズム(辞書と辞典)
- 自然言語処理における効果的な辞書情報更新アルゴリズム(辞書と辞典)
- D-046 ダブル配列における動的更新アルゴリズムの高速化(D分野:データベース)