話題の推移に基づく続報記事の自動抽出(自然言語)
スポンサーリンク
概要
- 論文の詳細を見る
ニュースなどの報道記事から特定の時間に特定の場所で生起した出来事に関する続報記事を自動的に抽出するためには,出来事に関する話題が時間の経過とともに変化する過程を的確にとらえる必要がある.本稿では,日付順に並べられた記事に対して,話題の推移を考慮した続報記事の抽出手法を提案する.我々は,特定の日時に報道された記事と同様の話題を持つ記事(記事集合)は,記事の話題が出来事の生起を伝える第1記事のほか,その記事と時間的に近い時期に比較的多く存在すると仮定し,類似した話題を持つ記事集合をその時点から過去に遡り推定するという方法を用いた.続報記事の抽出は,得られた記事集合を基に学習を行った後,テスト記事が続報であるか否かを判定することにより行われる.この処理はテスト記事が続報であると判定されるたびに,その記事を訓練記事集合に追加し,再度最適な記事集合を推定するという過程を繰り返すことにより行われる.TDT1コーパスを用いて実験した結果,訓練記事中の正例記事数が16記事の場合に,F値0.78の精度で続報記事を判定でき,また,異なる話題を多く含む出来事に対しても高精度で判定できることが分かった.
- 一般社団法人情報処理学会の論文
- 2003-07-15
著者
-
福本 文代
山梨大学大学院医学工学総合研究部
-
鈴木 良弥
山梨大学大学院医学工学総合研究部
-
福本 文代
山梨大学工学部
-
鈴木 良弥
山梨大学工学部コンピュータ・メディア工学科
-
山田 寛康
北陸先端科学技術大学院大学情報科学研究科
関連論文
- 単語の類似尺度に基づくシソーラス辞書への用例付与(学生セッション II)
- 音声対話システムにおけるタッチ情報を利用した現場指示詞の処理
- WordNetの同義語クラスとその上位関係を利用した文書の自動分類
- Web上から取得した共起頻度と音象徴によるオノマトペの自動分類(自然言語処理)
- マルチモーダルユーザインターフェースを備えた高次コミュニケーション空間の構築に関する研究開発通信放送機構委託研究(1997-2001)
- 単語の類似尺度に基づくシソーラス辞書への用例付与(学生セッション II)
- コーパスに基づく動詞の多義解消
- コーパスに基づく動詞の多義解消
- 超高速ATM LANの構築法と次世代ユーザーインタフェースに関する研究
- 階層構造におけるカテゴリの統合と類似文書抽出への適用(学生セッション I)
- 階層構造におけるカテゴリの統合と類似文書抽出への適用(学生セッション I)
- マルチラベルの分野名タグに対する事例間類似度に基づいた誤り修正(自然言語処理)
- 分野の階層構造を利用したコーパスの誤り修正と文書分類への適用(自然言語処理)
- TD-2-1 知的情報検索のための大規模言語データの利用(TD-2. WEB知的処理の基礎)
- 話題の推移に基づく続報記事の自動抽出(自然言語)
- 語義の曖昧性解消のための最適な属性選択
- 語義の曖昧性解消のための最適な属性選択
- 語の重み付け学習を用いた文書の自動分類
- 類推に基づく語の重み付け学習を用いた動詞の多義解消
- 音声とポインティングジェスチャを利用した指示物同定
- 文脈依存の度合を考慮した重要パラグラフの抽出
- ニュース文の話題セグメンテーション
- 3語の同時出現頻度を利用した前置詞句の係り先の曖昧性解消
- 辞書の語義文を用いた文書の自動分類
- ニュース文を対象とした話題の認識
- 日本語の述部階層構造に基づく形態論的な文法規則の記述法
- ニュース文を対象とした話題毎のセグメンテーション
- 3語の同時出現頻度を利用した前置詞句の係り先の曖昧性解消
- 係り受けの強度に基づく依存文法 : 制限依存文法
- 局所化した単一化文法とその表現
- 制限依存文法とその表現
- 音声対話装置に対するユーザの否定発話の抽出と処理方法(音声言語)
- ビデオ装置を例とした家電品の音声対話機能について(マルチモーダル)(「インタラクション:理論,技術,応用,評価」)
- F-12 サンプリング周波数に依存しない話者方向識別(音声・音声言語情報処理,F.音声・音楽)
- E-3 要約文生成のための集合名詞の要素の抽出(要約・情報検索,E.自然言語・文書)
- 格構造を利用した対話中の否定対象の推定
- 対話文中の否定表現の分析とその理解方法
- テレビ制御用音声対話システム
- 対話文に現われる否定表現の分類とその理解
- 不特定話者連続音声認識のための規則による音素識別
- 利用者からの要求を考慮したテキストデータからの知識抽出(アクティブマイニング)
- 韻律情報を利用した連続音声中の隣接句間の修飾関係有無の判定
- スケッチ画制御用音声対話システムにおける文脈情報の利用
- 音声認識のための連想辞書作成の一手法
- 音声対話システムにおける代名詞処理の試み
- 利用環境を考慮した音声対話システムの構築
- 意味属性を利用した音声認識のための連想情報について
- 話し言葉中の助詞の推定
- スケッチ画制御用音声対話システムの作成
- 対話音声中の助詞の補完とその評価
- 複数句を照合単位とした連続音声認識
- 韻律情報を利用した対話音声中の隣接句間の修飾関係の抽出
- 日本語連続音声認識のための韻律情報を利用した句境界の抽出
- 連続音声中の音素識別のための線形判別関数の話者適応
- 少数の正例とラベルなし事例による文書の自動分類(自然言語処理)
- Web掲示板における皮肉の分類および自動検出