専用ハードウェアを用いた形態素解析器の開発

概要

論文の詳細を見る
本論文では,形態素抽出から接続検定までを専用ハードウェアで実行する形態素解析器の構成・アルゴリズム・評価結果について述べる.本形態素解析器では,形態素解析処理を,(1)形態素抽出:単語辞書を検索してテキスト中に出現したと思われる単語(形態素)を抽出する過程,(2)接続検定:単語の隣接制約にもとづいて接続可能な単語を連結する過程,(3)候補選択:単語の組合せのなかから一番尤もらしいものを選択する過程,の3つに分け,(1)と(2)について専用ハードウェア(形態素抽出マシンMEX-IIと接続検定マシンMONC)を開発した.逐次型コンピュータを想定した従来の形態素解析アルゴリズムでは,ヒューリスティックスによる候補制御(解析候補の切り捨て)を用いて高速化するため,処理速度と解析精度との間にトレードオフの関係が生じている.しかし,MEX-IIとMONCによると,候補抑制なしに形態素抽出から接続検定までを,8万語辞書の場合?約9.5千文字/秒,24万語辞書の場合:約5.6千文字/秒,49万語辞書の場合:約2.4千文字/秒の処理速度で実行できる.この処理速度は,パーソナルコンピュータ(CPU:80386,クロック:20MHz)と比べて80倍以上高速である.これによって,解析候補の切り捨てを行うことなく,総当たり解析の精度を保ったまま高速化することが可能となった.
一般社団法人情報処理学会の論文
1995-03-15

専用ハードウェアを用いた形態素解析器の開発

スポンサーリンク

概要

著者

関連論文

スポンサーリンク