ブログ記事集合を用いたポストとコメントとの自動分離抽出手法の提案
スポンサーリンク
概要
- 論文の詳細を見る
近年のブログの普及により,ブログのコンテンツを利用するサービスや研究が盛んになってきている.ブログのコンテンツは,ポストと呼ばれるブログの書き手によるコンテンツと,コメントと呼ばれるブログの読者によるコンテンツに大分する事ができる.ブログのコンテンツを利用する場合は,それらが別々に抽出できている事が望ましい.本論文では,ブログ記事集合を用いる事により,ポストとコメントを自動的に分離抽出する手法を提案する.本手法は,ポストはブログ記事集合全てのブログ記事に出現するが,コメントはいずれかのブログ記事にしか出現しないというアイデアが基になっている.また,本手法のアルゴリズムを実装したソフトウェアを用いて実験を行い,日本語ブログサイトに対しての有効性を示す.
- 2009-11-13
著者
-
山本 幹雄
筑波大学システム情報工学研究科
-
山本 幹雄
筑波大学大学院システム情報工学研究科
-
乾 孝司
東京工業大学統合研究院
-
乾 孝司
奈良先端科学技術大学院大学情報科学研究科
-
吉田 光男
筑波大学大学院システム情報工学研究科
-
乾 孝司
筑波大学大学院システム情報工学研究科
-
山本 幹雄
沖テクノシステムズラボラトリ(株)
-
乾 孝司
奈良先端科学技術大学院大学情報科学研究科情報処理学専攻
-
吉田 光男
筑波大学大学院 システム情報工学研究科
-
山本 幹雄
豊橋技術科学大学情報工学系中川研究室
-
山本 幹雄
筑波大学システム情報系
関連論文
- トピック教師なしデータからのトピック依存評価表現モデルの獲得(「主観表現処理の最前線」シンポジウム)
- 社会課題とその解決に結びつく科学技術に関する有用知識の抽出
- 社会課題発見のための文書クラスタリングとクラスタ評価指標(情報分析・要約(テーマセッション1))
- スピンモデルによる単語の感情極性抽出(自然言語)
- 拡張固有表現タグ付きコーパスの構築(マイニング・知識獲得・固有表現)
- フレーズテーブル及び既存対訳辞書を用いた専門用語の訳語推定
- イベントの生起時間帯判定(分類, ブログ)
- 1.テキスト評価分析の技術とその応用(ユーザ作成のコンテンツに着目した嗜好・評判抽出, 利用者の好みをとらえ活かす-嗜好抽出技術の最前線-)
- フレーズテーブル及び既存対訳辞書を用いた専門用語の訳語推定(自然言語処理)
- 特許情報処理を指向したテストコレクションの構築 : 情報検索と自然言語処理の融合を目指して(NTCIR特別セッション)