未知語を考慮した形態素解析のための単語ラティスの効率的な生成方法
スポンサーリンク
概要
- 論文の詳細を見る
現在,形態素解析処理を実現するための手法として,単語ラティス上の経路の再順位付けにもとづくものが広く用いられている.しかし,この枠組みにおいて未知語を考慮した形態素解析を行う場合,入力文長に対して 2 乗のオーダの計算量が単語ラティスの生成に必要となってしまう.そのため,何らかの方法で,これを高速化することが実用上重要となる.本論文では,単語ラティス生成のために従来提案されていた枝刈りアルゴリズムは十分に効率的ではないこと,および,我々が考案した段階的アルゴリズムによって形態素解析処理がおよそ 10 倍高速化されることを示す.さらに,段階的アルゴリズムが生成する単語ラティスの大きさについて理論的な考察を行い,その妥当性を実験によって明らかにする.
- 2013-05-16
著者
関連論文
- オブジェクト指向技術とその応用論文特集の企画にあたって
- 6R-5 An Experimental Study on Basic Performance of Flash SSDs with Micro Benchmarks and Real Access Traces
- 6K-8 Jumbo : a data intensive distributed computation platform : design overview and preliminary experiment
- 5K-4 A study on Historical Web Graph Extraction
- Performance Evaluation of KD-Join Algorithm
- Implementation Technique of Join Operation on KD-Tree Indexed Relations
- 3J-7 Multimedia Object Placement in Transcoding-enabled Wide-area Storage Systems
- D-002 中規模IP-SANでの高多重度I/O処理の解析と性能向上手法(D分野:データベース)
- 2J-4 Efficient General Dominant Relationship Analysis based on Partial Order Models
- Dynamic Load Balancing in Right-Deep Pipelined Joins
- Extreme Skew Handling in Right-Deep Multi-Joins
- 1J-6 EcoR : An Economic Incentive model for facilitating storage of materialized query results in Mobile-P2P environments
- 6J-3 User-Assisted Similarity Estimation for Searching Related Web Pages
- ITをイネーブラとするプラットフォーマ学会を目指す:若手やんちゃ枠も作りたい -会長就任にあたって-
- マイクロブログにおける対話ネットワークと投稿内容を併用したユーザ推薦に関する一考察
- マイクロブログにおける対話ネットワークと投稿内容を併用したユーザ推薦に関する一考察
- SSDを利用したリレーショナルデータベースにおける大規模意思決定支援クエリ処理性能の特性
- SSDを利用したリレーショナルデータベースにおける大規模意思決定支援クエリ処理性能の特性
- マイクロブログを用いた鉄道の運行トラブル状況抽出に関する一検討
- マイクロブログを用いた鉄道の運行トラブル状況抽出に関する一検討
- 分散非共有計算機上におけるBtreeインデックスに対するヒート分散手法のシミュレーションによる評価
- 電力を考慮したアプリケーション構築のための計算機システムの提案
- テキストデータの未来関連情報における予定変更情報の獲得に関する研究
- アウトオブオーダ型データベースエンジンOoODEの試作実装と小規模実験環境におけるソフトウェア実行挙動の観測
- マイクロブログを用いた鉄道の運行トラブル状況抽出に関する一検討 (データ工学)
- マイクロブログにおける対話ネットワークと投稿内容を併用したユーザ推薦に関する一考察 (データ工学)
- 時々刻々と成長するグラフのための直径モニタリング
- マイクロブログからの鉄道の運行トラブル発生検出および継続状況の抽出 (特集 「機械学習と自然言語処理への応用」および一般)
- 語彙正規化との同時処理による高精度な形態素解析 (特集 「人工知能とデータサイエンス」および一般)
- 形態素解析における高速な単語ラティス生成
- SSDを利用したリレーショナルデータベースにおける大規模意思決定支i援クエリ処理性能の特性(ストレージ,ビッグデータを対象とした管理・情報検索・知識獲得及び一般)
- マイクロブログを用いた鉄道の運行トラブル状況抽出に関する一検討(twitter・ソーシャルネットワーク,ビッグデータを対象とした管理・情報検索・知識獲得及び一般)
- 未知語を考慮した形態素解析のための単語ラティスの効率的な生成方法
- マイクロブログにおける対話ネットワークと投稿内容を併用したユーザ推薦に関する一考察(twitter・ソーシャルネットワーク,ビッグデータを対象とした管理・情報検索・知識獲得及び一般)