ソーシャルメディアにおける空間的近接性と時間的一貫性を考慮した地名の曖昧性解消
スポンサーリンク
概要
- 論文の詳細を見る
近年,膨大な量の文書が Web 上に溢れるようになるにつれ,それらから有用な情報を抽出する技術が重要になってきた.特に,Twitter などのソーシャルネットワークサービス (SNS) は地域固有の情報を含むことが多いため,文書内の地名表現がどこの地名,地域を指しているかを同定することが必要となる.これまで,このような地名曖昧性解消の問題は,語義曖昧性解消の手法を利用して,語彙情報に基づいて解かれることが多く,地名特有の手がかりが使われていない.本研究では,(1) 空間的近接性と (2) 時間的一貫性の 2 つの手がかりを用いて,地名曖昧性解消の精度向上を目指す.空間的近接性は,投稿内の地名同士は距離が近いことが多いという傾向,時間的一貫性は,一連の投稿に現れる地名はそれぞれ関連性があるという傾向をとらえるために導入する.位置情報付きツイートを用いた実験によって,2つの手がかりの有効性を確認した.
- 2014-06-26
著者
関連論文
- 主要・対立表現の俯瞰的把握 : ウェブの情報信頼性分析に向けて(情報分析・要約(テーマセッション1))
- 表層・語彙的特徴量に基づくブログの面白さ分析(学生セッション I)
- 言語情報と映像情報の統合による物体のモデル学習と認識(自然言語,新しいパラダイムの中での分散システム/インターネット運用・管理)
- 文脈に依存した述語の同義関係獲得
- メッセージの背後に潜む「問い」の抽出
- 表層的語彙分布に基づく談話/テクストの主観性・主体性分析に向けて
- 言葉の背後に潜む『問い』の抽出 (ことば工学研究会(第14回)テーマ:ことばと身体性)
- Webページの大規模収集・検索基盤の構築と運用
- Webページの大規模収集・検索基盤の構築と運用
- D-035 Webページの著者の同定(データベース,一般論文)
- RE-002 二段階の機械学習を用いたボトムアップ型の固有表現認識(自然言語・音声・音楽,査読付き論文)
- キーワード蒸留型クラスタリングによる大規模ウェブ情報の俯瞰
- 格フレームの対応付けに基づく用言の言い換え
- 主要・対立表現の俯瞰的把握 : ウェブの情報信頼性分析に向けて(情報分析・要約(テーマセッション1))
- 自動構築した大規模格フレームに基づく構文・格解析の統合的確率モデル
- 格フレームを用いた自然言語処理(下)格フレームに基づく構文・格解析とその応用
- 格フレームを用いた自然言語処理(上)基本語彙の整理と格フレームの自動獲得
- 高性能計算環境を用いたWebからの大規模格フレーム構築
- 名詞格フレーム辞書の自動構築とそれを用いた名詞句の関係解析
- 格フレーム辞書の漸次的自動構築
- 自動構築した格フレーム辞書と先行詞の位置選好順序を用いた省略解析
- 用言と直前の格要素の組を単位とする格フレームの自動構築
- 用言と直前の格要素の組を単位とする格フレームの自動獲得
- 京都大学自然言語処理ツール
- 表層・語彙的特徴量に基づくブログの面白さ分析(学生セッション I)
- E-009 長い複合名詞の構造的な固有表現認識(自然言語・音声・音楽,一般論文)
- 言語情報と映像情報を統合した隠れマルコフモデルに基づくトピック推定(自然言語)
- 述語項構造の共起情報と格フレームを用いた事態間知識の自動獲得
- 構文・照応・評価情報つきブログコーパスの構築
- E-003 大規模ウェブ情報クラスタリングにおけるラベルの組織化(自然言語・音声・音楽,一般論文)
- 談話構造解析に基づくスライドの自動生成
- 料理教示発話の理解と作業構造の自動抽出(特別セッション「言語理解と行動」(2))
- 料理教示発話の理解と作業構造の自動抽出(特別セッション : 言語理解と行動(2))
- 作業教示映像の構造的理解へ向けて(マルチメディアとパターン認識理解,一般)
- 大規模語彙的知識に基づく受身形と能動形の表層格の対応付け
- 非計算機的計算に向けて(編集委員今年の抱負2013)
- 語彙と文脈情報を用いた反義の詳細クラス分類
- 多様な文書の書き始めに対する意味関係タグ付きコーパスの構築
- 2段階のクラウドソーシングによる談話関係タグ付きコーパスの構築
- ソーシャルメディアにおける空間的近接性と時間的一貫性を考慮した地名の曖昧性解消
- ボルダーと京都の比較研究(世界のAI,日本のAI〔第23回〕)