時系列ニュース記事における最新話題語抽出方法(重要語抽出・検索・文書分類)
スポンサーリンク
概要
- 論文の詳細を見る
逐次増加するニュース記事中に含まれる話題情報を効率的に把握するため, 新鮮で可能な限り多くの幅広い話題情報を最新話題語と呼ぶキーワードの形態で抽出する手法について報告する.ニュース記事中の話題を扱うにあたり, 世間の注目度が高い出来事を伝える記事数が増加する「話題の広がり」と, 広がり状態が続報記事発行によって時間的に持続する「話題の伸び」の2つの側面に注目する.提案手法では, 話題の整理のために記事をジャンル分類・クラスタリングした後, 記事のタイムスタンプから算出する記事新鮮度, および記事間類似度を用いて各クラスタを代表する最新話題語を抽出する.ニュース記事(2164記事)を対象にした評価実験の結果, 提案手法はクラスタ中の新鮮かつ代表的な話題を表し, さらに受容性も高い語句を抽出可能であることを確認した.
- 社団法人情報処理学会の論文
- 2005-07-22
著者
-
川島 晴美
日本電信電話株式会社NTTサイバーソリューション研究所
-
奥 雅博
NTTソフトウェア株式会社
-
奥 雅博
日本電信電話株式会社NTTサイバーソリューション研究所
-
佐藤 吉秀
日本電信電話株式会社 NTTサイバーソリューション研究所
-
佐々木 努
日本電信電話株式会社NTTサイバーソリューション研究所
-
奥 雅博
日本電信電話株式会社 Ntt光ソフトサービス推進プロジェクト
関連論文
- コメント・トラックバック分析に基づくブログ記事の影響度判定(Webマイニング,情報爆発論文)
- 映像解析技術に基づく編集機能をもつモバイル映像ブログシステム(コンテンツ技術,Web情報システム)
- 仮想マルチスペクトルカメラ表現を用いたスペクトルに基づく画像生成法 (画像符号化・映像メディア処理レター特集)
- 仮想マルチスペクトルカメラ表現を用いたスペクトルに基づく画像生成法(画像認識,コンピュータビジョン)
- 映像シーン連動型掲示板コミュニケーションを用いたコミュニティ協働型メタデータ抽出方法(コンテンツ技術,Web情報システム)
- QAコミュニティの成長パターンに基づく回答者への質問推薦
- ブログ記事の反響特性分析 (特集 いまだかつてない検索サービス実現に向けたWebコンピューティング技術)
- ブログ文書集合を用いた語句関連性の抽出手法 (特集 いまだかつてない検索サービス実現に向けたWebコンピューティング技術)
- QAサイトにおける質問応答グラフの成長パターン分析(セッション7a:Web解析)
- E-012 ブログからの未来に関する表現の抽出(自然言語・音声・音楽,一般論文)
- 読者に影響を与えるブログ記事発見手法(セッション1:web・ブックマーク)
- QAサイトにおける質問応答グラフの成長パターン分析
- QAサイトにおける質問応答グラフの成長パターン分析
- 単語出現の意外性に基づく話題性評価方法(評判分析・文脈解析)
- ブログ文書集合を用いた省略語抽出手法の検討(夏のデータベースワークショップ2007(データ工学,一般))
- ブログ文書集合を用いた省略語抽出手法の検討(SNS・blog,夏のデータベースワークショップ2007(データ工学,一般))
- ブログ文書集合を用いた省略語抽出手法の検討
- ブログ文書集合を用いた省略語抽出手法の検討
- ブログ文書集合を用いた省略語抽出手法の検討
- ブログ文書集合を用いた省略語抽出手法の検討
- "気づき"に着目した情報提供システム「HotWindow」の開発(マルチメディア処理)
- ブログ発信者の特徴を利用した話題抽出手法
- 俯瞰的アプローチに基づく情報場ナビゲーション技術 (特集 次世代ポータル技術)
- blogページ集合に対する話題語句抽出手法(分類, ブログ)
- blogページ集合に対する話題語句抽出手法(分類, ブログ)
- 時系列ニュース記事における最新話題語抽出方法(重要語抽出・検索・文書分類)
- 時系列ニュース記事における最新話題語抽出方法(重要語抽出・検索・文書分類)
- 時系列ニュース記事における最新話題語抽出方法(重要語抽出・検索・文書分類)
- 文書の類似度と新鮮度に基づく話題語抽出(情報抽出)
- ネットワーク世界の"今"を切り取る「最新情報窓」
- 比較評価情報を用いたオブジェクトのランキング手法 (特集 いまだかつてない検索サービス実現に向けたWebコンピューティング技術)
- 話題構造抽出に基づく会議音声インデクシングシステム(音声,聴覚)
- マルチスペクトル撮影による光源スペクトルの計測(画像認識,コンピュータビジョン)
- 単語概念ベクトルを用いた文書群からの代表語抽出(テーマ,膨大なデータから学ぶもの)
- ウェブ検索を利用したしきい値選択型テキストセグメンテーション(jDBワークショップ)
- Blogからの体験情報抽出(Webインテリジェンス,情報洪水時代のネットワークサービス)
- 目的指向型ブログ検索システムBLOGRANGERの提案およびユーザ評価
- 血管特徴を用いた眼底画像合成法(画像認識,コンピュータビジョン)
- Memory-Retriever : 体験獲得情報を想起させる行動検索手法(情報検索,インタラクション技術の原理と応用)
- グラフ分析を利用した文書集合からの話題構造マイニング(テキストマイニング,データ工学論文)
- ポータルサービスを支えるナビゲーション技術(オフィスインフォメーションシステム及び一般)
- グループトピックス 第3回 NTTコア技術シンポジウム「ポータル技術シンポジウム」開催報告
- 新しいポータルサービスの創出を目指して (特集 次世代ポータル技術)
- 適応型組み立てコンテンツサービスシステム Media Tray の提案
- コメント・トラックバック分析に基づくブログ記事の影響度判定
- 投稿型教育支援システム「国体応援ニュース」の開発とその評価
- 単語概念ベクトルを用いた文書群からの代表語抽出(テーマ,膨大なデータから学ぶもの)
- ウェブ検索を利用したしきい値選択型テキストセグメンテーション(jDBワークショップ)
- ギガビットネットワークを利用した肺がん検診用ネットワーク読影支援システム
- ギガビットネットワークベース胸部 CT 検診支援システム
- 医療情報ネットワークとしての肺がん検診用ネットワーク読影検診支援システム (特集論文 医療システム)
- ギガビットネットワークを利用した肺がん検診用ネットワーク読影支援システム
- 肺がん検診用ネットワーク読影支援システム
- 13-4 肺がん検診用読影支援システムにおけるレポートシステムの開発
- A-15-21 ハイパーリンクコンテンツ速覧支援システム「ForeScope」の実証実験による評価(A-15. ヒューマン情報処理, 基礎・境界)
- ハイパーリンクコンテンツの速覧支援システム「ForeScope」における先読み手法の提案と評価
- NaMiSEN: ウェブ閲覧履歴への個人嗜好情報付加・抽出ツールの開発(オフィスにおけるデジタルドキュメント/コンテンツ管理技術及び一般)
- NaMiSEN: ウェブ閲覧履歴への個人嗜好情報付加・抽出ツールの開発(オフィスにおけるデジタルドキュメント/コンテンツ管理技術及び一般)
- Web ページのヘッドライン生成のための統計的要約
- Media Tray : ユーザが構成可能なカフェテリア型コンテンツ視聴環境(マルチメディア処理)
- マップ散策型コンテンツガイド「AssociaGuide」(マルチメディア処理)
- D-5-9 大局的な話題のキャンセリングに基づく隠れた話題の発見システム(D-5.言語理解とコミュニケーション,一般講演)
- 時系列ニュース記事における最新話題語抽出方法(重要語抽出・検索・文書分類)
- A-15-10 ユーザビュー適用型コンテンツガイドシステムの提案
- ウェブ検索を利用したしきい値選択型テキストセグメンテーション
- 血管の接続性を考慮したパノラマ眼底画像の作成
- 単語・意味属性間共起に基づくコーパス概念ベースの生成方式
- 数10万件のコンテンツを対象とするにぎわい情報を用いたナビゲーションインタフェース
- 研究最前線からの報告--日英両言語の機械翻訳の現状と将来の展望
- 未知語の概念ベクトル推定手法(知識獲得,知識表現,生成)
- 未知語の概念ベクトル推定手法(知識獲得,知識表現,生成)
- E-016 種会話からの派生による話し言葉コーパス構築(E.自然言語・文書・ゲーム)
- 9-7 医療画像転送システムにおけるセキュリティの検討
- D-16-11 医用画像転送におけるセキュリティの検討
- 7-12 肺がん検診用CT画像ネットワーク読影支援法の一提案
- 単語概念ベクトルを用いた文書群からの代表語抽出
- 単語概念ベクトルを用いた文書群からの代表語抽出
- PB電話機を用いた自動電話番号案内システムの開発と評価(データ工学,Web情報システム,システム開発論文)
- RD-003 知名度の地理的広がりを考慮した実世界スポットの地域局所性推定(D分野:データベース)