未知語を考慮した形態素解析のための単語ラティスの効率的な生成方法
スポンサーリンク
概要
- 論文の詳細を見る
現在,形態素解析処理を実現するための手法として,単語ラティス上の経路の再順位付けにもとづくものが広く用いられている.しかし,この枠組みにおいて未知語を考慮した形態素解析を行う場合,入力文長に対して 2 乗のオーダの計算量が単語ラティスの生成に必要となってしまう.そのため,何らかの方法で,これを高速化することが実用上重要となる.本論文では,単語ラティス生成のために従来提案されていた枝刈りアルゴリズムは十分に効率的ではないこと,および,我々が考案した段階的アルゴリズムによって形態素解析処理がおよそ 10 倍高速化されることを示す.さらに,段階的アルゴリズムが生成する単語ラティスの大きさについて理論的な考察を行い,その妥当性を実験によって明らかにする.
- 2013-05-16
著者
関連論文
- オブジェクト指向技術とその応用論文特集の企画にあたって
- 6R-5 An Experimental Study on Basic Performance of Flash SSDs with Micro Benchmarks and Real Access Traces
- 6K-8 Jumbo : a data intensive distributed computation platform : design overview and preliminary experiment
- 5K-4 A study on Historical Web Graph Extraction
- Performance Evaluation of KD-Join Algorithm
- Implementation Technique of Join Operation on KD-Tree Indexed Relations
- 3J-7 Multimedia Object Placement in Transcoding-enabled Wide-area Storage Systems
- D-002 中規模IP-SANでの高多重度I/O処理の解析と性能向上手法(D分野:データベース)
- 2J-4 Efficient General Dominant Relationship Analysis based on Partial Order Models
- Dynamic Load Balancing in Right-Deep Pipelined Joins