時間変化する特徴語によるマイクロブログ地名曖昧性解消
スポンサーリンク
概要
- 論文の詳細を見る
本研究では,Twitterなどの文章が短いマイクロブログを対象として,位置に関する特徴語を利用した地名の曖昧性解消手法を提案する.従来,同名地名の曖昧性解消には地理的に近い地名との共起が用いられていた.しかし,マイクロブログは文章が短いため,地名以外の単語も曖昧性解消に利用すべきである.そこで,マイクロブログの投稿にはその場所特有のトピックが存在することが多いと考え,地名ごとにその場所特有の単語(特徴語)を利用することで地名の曖昧性解消を行う.特徴語は季節変動などに依存しない定常的なものと,時間の経過によって変化する非定常的なものが存在する.そのため,定常的な特徴語(静的特徴語)を観光案内やWikipediaの説明文のような静的な文書から抽出し,地名と静的特徴語の共起により曖昧性解消を行う.ここでは季節変動や時期に依存しない特徴語を利用する.一方,非定常的な特徴語(動的特徴語)はマイクロブログの特徴であるリアルタイム性を反映し,場所のトピックが時間とともに変化すると考え,従来手法により曖昧性解消された投稿から地名ごとの特徴語を動的に生成し曖昧性解消に利用する.提案手法の有効性を確認するため,再現率および適合率を評価した.地名に対して人手により正解ラベルを付与し正しく抽出できる数を調査した.その結果,従来手法の地理的に近い地名との共起をベースラインとして,提案手法の有効性を確認した.
- 2014-06-30
著者
関連論文
- 生活密着情報を提供するリアルタイム検索サービスの開発
- 時間変化する特徴語によるマイクロブログ地名曖昧性解消
- 位置に関連するツイート解析技術とその応用
- D-037 場所に関する特徴語を利用したリアルタイム地名曖昧性解消手法(D分野:データベース)