複数文書からの人物時系列情報の抽出手法
スポンサーリンク
概要
- 論文の詳細を見る
本稿では文書から人物情報を抽出する手法を提案する.人物情報にはその人が持つ属性や関連するエピソードなどがある.我々はある人物に関する出来事をその人物についての文書群から抽出し,時系列順に提示することを考える.このような情報はその人物の経歴を理解するのに有用である.本手法は2段階からなり,まず複数文書から対象とする人物名と日付表現の両方が含まれる文を抽出する.次にこれらの文から対象人物に関する出来事について書かれていないものや信頼性の低い記述をフィルタリングする.そのために日付表現や出来事を表す語の出現頻度に基づいたルールを用いる.また人物名をキーワードにして検索エンジンから得られる文書群に対して本方法を適用し抽出された結果について報告する.
- 2007-11-15
著者
-
河野 隆志
日本電信電話株式会社nttサイバーソリューション研究所
-
中渡瀬 秀一
日本電信電話株式会社NTTサイバーソリューション研究所
-
嶺 真一
日本電信電話株式会社NTTサイバーソリューション研究所
-
畑 秀明
大阪大学大学院情報科学研究科
関連論文
- 文書情報統合のためのテキスト表現モデルの提案と主題グラフを用いた実現
- 複数文書からの人物時系列情報の抽出手法
- 複数文書からの人物時系列情報の抽出手法
- スパムフィルタを用いたFault-proneモジュール検出法の予測精度に関する従来法との比較評価(研究速報)
- メソッド呼び出しに関する不具合修正での変更作業の分析
- 暗号・電子署名を用いたファイル共有システムの構築
- 第30回ソフトウェア工学国際会議(ICSE2008)参加報告(報告)
- メソッドに対するコメント文記述の変更履歴とメソッドの不具合との関係に関する実証的考察 (ソフトウェアサイエンス)
- 1-2 スパムフィルタリングに基づくフォールトプローンモジュール検出器の開発(セッション1「プロジェクト管理・ソフト」)
- BBSにおける検索クエリ文と記事中の単語間関連度を用いた記事検索方式
- 文書情報統合のためのテキスト表現モデルの提案と主題グラフを用いた実現
- 名詞句と単語の勢いを用いた話題抽出手法の提案(情報抽出・データマイニング)
- 発信協調型ナレッジ共有システムの提案
- ブログ記事要約における重要文位置の調査
- 特徴的な固有表現を用いたラベル指向ナビゲーション手法の提案
- E-011 記事群の冗長度を削減するためのRSSニュースリーダ(E分野:自然言語)
- 発信者によるコンテンツ登録・流通制御型ポータル構成方法
- 不具合修正に関わるメソッド呼び出しの変更についての定量的分析
- ソースコードの構造に対する体系的変更内容の復元 (知能ソフトウェア工学)
- ソースコードの構造に対する体系的変更内容の復元 (ソフトウェアサイエンス)
- メソッドに対するコメント文記述の変更履歴とメソッドの不具合との関係に関する実証的考察
- ソースコードの構造に対する体系的変更内容の復元
- ソースコードの構造に対する体系的変更内容の復元
- 開発履歴メトリクスを用いた細粒度なFault-proneモジュール予測
- プログラム構造の簡略化によるメトリクス計測方法の改善(一般)
- プログラム構造の簡略化によるメトリクス計測方法の改善(一般)
- プログラム構造の簡略化によるメトリクス計測方法の改善