統計的手法に基づくWebページからのヘッドライン生成
スポンサーリンク
概要
- 論文の詳細を見る
現状の検索エンジンが出力する文書リストの概要文はWebページの先頭数十文字などであるため内容が把握できず、必要な情報に効率よくアクセスできない。これを解決するためには、概要文の代わりにWebページの内容を簡潔に表したヘッドラインを提示すればよい。そこで本研究は、Webページからその内容を簡潔に表したヘッドラインを自動生成することを目的とする。ヘッドラインは「(1)内容網羅性」、「(2)可読性」、「(3)高圧縮性」の3条件を満たす必要があるが、従来のテキスト要約技術ではこれらの3つの条件を同時に満たすことができない。本研究では、2値分類の機械学習手法であるSupport Vector Machine(SVM)を用いて、単語がヘッドラインとして必要か不要かに分類することにより重要語の選択を行い、単語trigramモデルと単語の重要度を組み合わせたNoisy channel modelを用いてヘッドライン生成を行う方法を提案する。Webページを用いた評価実験の結果、提案した重要語選択モデルはTF・IDFモデルより優れていることを検証し、これを用いたヘッドライン生成実験においてTF・IDFモデルに基づくベースライン手法よりテキスト全体の内容をより的確に表せることを検証した。
- 一般社団法人情報処理学会の論文
- 2002-05-23
著者
-
山崎 毅文
日本電信電話株式会社NTTサイバーソリューション研究所
-
廣嶋 伸章
NTTレゾナント株式会社
-
廣嶋 伸章
日本電信電話株式会社 NTTサイバーソリューション研究所
-
長谷川 隆明
日本電信電話株式会社サイバースペース研究所
-
山崎 毅文
株式会社nttレゾナント
-
長谷川 隆明
日本電信電話株式会社NTTサイバースペース研究所
関連論文
- ホームICTサービス展開に向けた標準化の取り組みについて(ホームネットワーク,ユビキタスネットワーク,コンテキストアウェア,eコマース及び一般)
- ホームICTサービス展開に向けた標準化の取り組みについて(ホームネットワーク,ユビキタスネットワーク,コンテキストアウェア,eコマース及び一般)
- ホームICTサービス展開に向けた標準化の取り組みについて
- 話題構造抽出に基づく会議音声インデクシングシステム(音声,聴覚)
- 目的指向型ブログ検索システムBLOGRANGERの提案およびユーザ評価
- マルチファセット型ブログ検索システムBLOGRANGERの開発(オフィスインフォメーションシステム及び一般)
- 概念ベースに基づくWeb検索のクエリタイプ判定手法とその評価
- 評判検索におけるクエリ依存型の評価極性付与(意見・評判情報処理)
- ブログ記事からの意見文検索(意見・評判情報処理)
- 評判検索におけるクエリ依存型の評価極性付与
- Web ページのヘッドライン生成のための統計的要約
- 関連語彙獲得に基づく認識辞書のオフライン教師なし適応(音声・音響処理)
- 関連語彙獲得に基づく認識辞書のオフライン教師なし適応(音声・音響処理)
- D-14-11 音声認識結果の単語系列の言語的妥当性に基づく正誤判定(D-14. 音声・聴覚)
- 話題構造抽出に基づく会議音声インデクシング
- 統計的手法に基づくWebページからのヘッドライン生成
- ホームICT周辺の標準化動向(ネットワーク品質,トラヒック計測,一般)
- ホームICT周辺の標準化動向(ネットワーク品質,トラヒック計測,サービス品質,一般)
- ホームICT周辺の標準化動向(ネットワーク品質,トラヒック計測,サービス品質,一般)
- テキストマイニング : 事例紹介(「テキストマイニング」)
- 電子メールにおける重要文抽出と携帯電話向け要約システムへの適用(コンテンツ処理)
- テキストマイニング
- BT-5-5 ホームICT関連の標準化の取り組みについて(BT-5.ホームICTとその管理,チュートリアルセッション,ソサイエティ企画)
- ホームICT周辺の標準化動向
- ホームICT周辺の標準化動向
- B-8-37 複数セグメント上でのホームネットワーク構成特定手法の検討(B-8. 通信方式,一般セッション)
- B-14-1 アプリケーション動作形態に柔軟に対応可能なホームICTサービス提供手法の検討(B-14. 情報通信マネジメント,一般セッション)
- ホームICT関連の標準化の取り組みについて(管理機能,理論・運用方法論,及び一般)
- BI-7-2 ホームICTサービス実現のための基盤技術OSGi標準化の動向(BI-7.スマートハウスを支えるホームネットワーク新技術-スマートメータやセンサ、家電、モバイル機器がつながる未来へ-,依頼シンポジウム,ソサイエティ企画)
- 地域特有の話題発見を支援するスマートフォン向けマップ型検索システム : 発見探地図エリアダス(地理情報システム,データ工学と情報マネジメント論文)
- Evaluative Text Summarization Model with Sentence Extraction and Ordering
- 生活支援サービス連携システムにおいて柔軟に人的リソース割当を行う手法の検討(情報セキュリティ,ライフログ活用技術,ライフインテリジェンス,オフィス情報システム,一般)
- 生活支援サービス連携システムにおいて柔軟に人的リソース割当を行う手法の検討(情報セキュリティ,ライフログ活用技術,ライフインテリジェンス,オフィス情報システム,一般)
- D-019 POI情報を利用したWeb文書からの地名の抽出(D分野:データベース)