品詞の並びに関するヒューリスティックスを用いた日本語同語反復表現の検出

スポンサーリンク

概要

論文の詳細を見る
自然言語における修辞的表現の一種である「同語反復表現」を計算機で検出する一手法を提案する.同語反復表現とは,「彼は彼,私は私だ」や「建物という建物が倒壊した」のように,一文中で同じ語(反復語)が繰り返され,かつ表層的な処理では意味解析できない表現のことである.本稿で提案する手法は,形態素解析によって品詞の同定を行い,反復語とその周辺の単語の品詞の並びに関するテンプレートを学習データから予め人手で作成しておき,そのテンプレートとのマッチングによって,対象とする文から同語反復表現を検出するものである.新聞記事データを用いた予備的な実験では,本手法によって,80.6%の呼出率で検出できることが示された.
一般社団法人情報処理学会の論文
1995-11-17

著者

関連論文

もっと見る

スポンサーリンク