日本語語義曖昧性解消のための訓練データの自動拡張

スポンサーリンク

概要

論文の詳細を見る
本稿では，訓練データの自動拡張による語義曖昧性解消の精度向上方法について述べる．評価対象として，SemEval-2010 日本語語義曖昧性解消タスクを利用した．本稿では，まず，配布された訓練データのみを利用して学習した場合の結果を紹介する．更に，辞書の例文，配布データ以外のセンスバンク，ラベルなしコーパスなど，さまざまなコーパスを利用して，訓練データの自動拡張を試みた結果を紹介する．本稿では，訓練データの自動獲得により 79.5% の精度を得ることができた．更に，対象語の難易度に基づき，追加する訓練データの上限を制御したところ，最高 80.0% の精度を得ることができた．
言語処理学会の論文

言語処理学会 | 論文

もっと見る

スポンサーリンク