最適化問題としての文書要約
スポンサーリンク
概要
- 論文の詳細を見る
We derived the oracle summary with the highest ROUGE score that can be achieved by integrating sentence extraction with sentence compression from the reference abstract. The analysis results of the oracle revealed that summarization systems have to assign an appropriate compression rate for each sentence in the document. In accordance with this observation, this paper proposes a summarization method as a combinatorial optimization: selecting the set of sentences that maximize the sum of the sentence scores from the pool which consists of the sentences with various compression rates, subject to length constrains. The score of the sentence is defined by its compression rate, content words and positional information. The parameters for the compression rates and positional information are optimized by minimizing the loss between score of oracles and that of candidates. The results obtained from TSC-2 corpus showed that our method outperformed the previous systems with statistical significance.
著者
-
鈴木 潤
日本電信電話株式会社 Nttコミュニケーション科学基礎研究所
-
磯崎 秀樹
日本電信電話(株)NTTコミュニケーション科学基礎研究所
-
平尾 努
日本電信電話株式会社NTTコミュニケーション科学基礎研究所
-
磯崎 秀樹
日本電信電話株式会社 Nttコミュニケーション科学基礎研究所
関連論文
- 最適化問題としての文書要約
- モデル検査に基づく知識・信念の推定(「定理証明, 推論関係の新技術」)
- 抜粋による複数文書要約を評価するためのコーパスと評価指標
- 生成・識別モデルの統合に基づく半教師あり学習法とその多重分類への応用
- F値最大化学習に基づく文書の多重ラベリング(機械学習)
- 高次元特徴空間に適した半教師あり条件付確率場の検証(機械学習)
- 識別学習による組合せ最適化問題としての文短縮手法
- 単一言語コーパスにおける文の自動対応付け手法(自然言語)
- 階層非循環有向グラフカーネル(情報論的学習理論論文)
- SVMを用いた学習型質問応答システムSAIQA-II(自然言語)
- 単語属性N-gramと統計的機械学習による質問タイプ同定(自然言語)(「インタラクション:理論,技術,応用,評価」)
- 機械学習のための組み合わせ素性の選択基準について(分類、クラスタリング,機械学習)
- 言語パターンに着目した複数文書要約(要約)
- 機械学習のための組み合わせ素性の選択基準について(分類、クラスタリング, 機械学習)(言語理解とコミュニケーション)
- 言語パターンに着目した複数文書要約(言語理解とコミュニケーション)
- 機械学習のための組み合わせ素性の選択基準について
- 言語パターンに着目した複数文書要約
- 素性選択機能をもったString Kernelの提案(パタン発見)(セマンティックウェブと自然言語処理その他一般)
- 素性選択機能をもった String Kernel の提案
- 階層構造を利用したテキスト間類似度の効率的計算法
- LE-10 統計的機械学習を用いた質問タイプ同定(E. 自然言語・文書)
- SAIQA : 大量文書に基づく質問応答システム
- SAIQA : 大量文書に基づく質問応答システム
- 聞き役対話システムの構築を目的とした聞き役対話の分析
- 構文情報に依存しない文短縮手法
- 生成・識別モデルの統合に基づく半教師あり学習法とその多重分類への応用
- 投票型回帰モデルによる要約の自動評価法
- 辞書式順序を持つペナルティによるゼロ代名詞解消(自然言語)
- 拡張ストリングカーネルを用いた要約システムの自動評価法(自然言語,情報処理技術のフロンティア)
- 最大マージン原理に基づく多重ラベリング学習(自然言語処理)
- 文書要約の自動評価手法の提案と評価(セグメンテーション・要約)
- 優先度学習を用いた自然言語処理(解析)
- 生物医学文献からの遺伝子機能フレーズの抽出(抽出,マイニング)
- 自然言語処理のためのSVM高速化
- 自然言語処理のためのSVM高速化
- 自動要約評価型ワークショップ : Text Summrization Challenge(TSC)(音声・言語における標準化動向)(第6回音声言語シンポジウム)
- 自動要約評価型ワークショップ : Text Summrization Challenge(TSC)(音声・言語における標準化動向)(第6回音声言語シンポジウム)
- 自動要約評価型ワークショップ : Text Summrization Challenge(TSC)(音声・言語における標準化動向)(第6回音声言語シンポジウム)
- 動向情報の要約と可視化に関するワークショップの提案(検索,要約)
- 動向情報の要約と可視化に関するワークショップの提案(検索,要約)
- 音声インタラクティブODQAの構築とその評価
- 固有表現抽出のためのSVMの高速化
- 質問応答システム:SAIQA--何でも答える物知り博士 (特集論文1 高度検索技術)
- 質問に適応した文書要約手法とその評価
- 生物医学文献からの遺伝子機能フレーズの抽出(抽出, マイニング)(言語理解とコミュニケーション)
- 音声駆動型QAシステム実現のための言語モデルと対話戦略の検討 (テーマ:一般)
- 4. 論理の逆計算 : 計算機科学の立場から( 逆計算: 計算の理論における逆問題)
- 生物医学文献からの遺伝子機能フレーズの抽出
- セグメント単位の評価指標最大化に基づく条件付確率場の学習
- Support Vector Machineを用いた重要文抽出法(自然言語)
- 機械学習による複数文書からの重要文抽出
- LE-11 機械学習を用いた複数文書要約(E. 自然言語・文書)
- SVMに基づく固有表現抽出の高速化
- メタルールと決定木学習を用いた日本語固有表現抽出(システムLSIの設計技術と設計自動化)
- セグメント単位の評価指標最大化に基づく条件付確率場の学習(自然言語処理)
- 大規模データを用いた半教師あり学習による高精度係り受け解析モデルの学習
- マルチエージェント環境における遡行的信念推定アルゴリズム
- トランザクション論理におけるプログラム変換