ソーシャルメディア上の発信内容に基づく著者属性キーワードの推定
スポンサーリンク
概要
- 論文の詳細を見る
ソーシャルメディアのユーザーの職業や趣味,家族構成といった属性を推定することは,データ収集対象とするユーザーの選択や,投稿内容の分析に有効活用できることが期待されるため,近年盛んに取り組まれている.しかし,既存手法の多くは,推定の対象とするユーザーの属性をあらかじめ数個の分類クラスとして定義する必要があるため,分析に有用なユーザー属性が前もって分からない状況では利用が難しい.このような状況を考慮し,本研究ではソーシャルメディア上の各ユーザーアカウントに提供されている著者自己紹介欄を利用して,ここに著者の属性を表す単語 (著者属性キーワード) が記述される確率を推定する問題として属性推定を解くこと,そして,その推定において当該著者がソーシャルメディア上で発信している内容を利用することを提案する.筆者らは,ソーシャルメディアの著者が発信している内容からその著者属性キーワードを求めるにあたって,文書に付与されるべきタグを文書の内容に基づいて推定するタスクとの類似点に着目し,タグ推定向けのトピックモデルを応用することを試みた.本論文ではいくつかのトピックモデルを適用した結果を比較し,考察する.
- 一般社団法人情報処理学会の論文
- 2014-05-15
著者
-
金山 博
日本アイ・ビー・エム株式会社東京基礎研究所
-
金山 博
日本アイ・ピー・エム(株)東京基礎研究所
-
吉田 一星
日本アイ・ビー・エム(株)東京基礎研究所
-
金山 博
日本アイ・ビー・エム(株) 東京基礎研究所
-
西山 莉紗
日本アイ・ビー・エム株式会社東京基礎研究所
関連論文
- 2.テキストを用いた評判と嗜好の分析(ユーザ作成のコンテンツに着目した嗜好・評判抽出, 利用者の好みをとらえ活かす-嗜好抽出技術の最前線-)
- UIMA : 非構造情報処理アーキテクチャ(研究のツールボックス 第6回)
- 木構造変換を利用した評判分析手法
- 翻訳精度評価手法BLEUの日英翻訳への適用
- 安全語のアンマスキングによる機密情報マスキングシステム(情報抽出2,夏のデータベースワークショップDBWS 2006)
- 安全語のアンマスキングによる機密情報マスキングシステム(情報抽出)
- 読点に頼らない統計的構文解析(解析, 分析)
- 統計的日本語構文解析器の部分的修正(解析)
- 文脈一貫性を利用した極性付評価表現の語彙獲得(語彙的知識獲得)
- IBMプロフェッショナル論文 対話的テキストマイニングのためのソフトウェアアーキテクチャー
- 大規模データのための対話的テキストマイニング
- Watson--クイズ番組に挑戦する質問応答システム
- 質問応答システムWatsonが示す未来--質問応答技術がもたらす情報処理の新たな世界
- Watson : クイズ番組に挑戦する質問応答システム(第12回音声言語シンポジウム:情報アクセス,音声・言語処理一般)
- Watson : クイズ番組に挑戦する質問応答システム(第12回音声言語シンポジウム:情報アクセス,音声・言語処理一般)
- 質問応答システムWatsonのクイズ番組における対戦(テーマセッション,大規模マルチメディアデータを対象とした次世代検索およびマイニング)
- 質問応答システムWatsonのクイズ番組における対戦(テーマセッション,大規模マルチメディアデータを対象とした次世代検索およびマイニング)
- 2012年度喜安記念業績賞紹介:知識の蓄積による問題解決に向けた新たな試み
- ソーシャルメディア上の発信内容に基づく著者属性キーワードの推定
- ソーシャルメディア上の発信内容に基づく著者属性キーワードの推定