重要文と要約の差異に基づく要約手法の調査

概要

論文の詳細を見る
文書中から重要分を抽出する技術が開発されてきているが、人間の作成した要約とはかなりのギャップがある。我々は、人間の作成した要約の性質を知るために、新聞記事を対象に100人の被験者から自由作成の要約、重要文抽出、重要文をつなぎ合わせた要約を収集し、2種類の要約の差異に基づく調査を行なった。2種類の要約について、ツールと人手によって原文との対応付けを行ない、この対応結果から、重要文と要約での原文情報のカバーの違い、要約の原文との対応率、語順の傾向、指示詞と接続詞の使用について調べた。
一般社団法人情報処理学会の論文
2000-01-27

著者

荻野紫穂
日本IBM東京基礎研究所
荻野紫穂
日本アイ・ビー・エム株式会社東京基礎研究所
荻野紫穂
日本ibm株式会社東京基礎研究所
井佐原均
郵政省通信総合研究所関西先端研究センター知的機能研究室
井佐原均
独立行政法人情報通信研究機構
望主雅子
(株)リコー情報通信研究所
太田公子
独立行政法人通信総合研究所
太田公子
郵政省通信総合研究所
井佐原均
郵政省通信総合研究所
望主雅子
(株)リコーソフトウェア研究所
望主雅子
(株)リコー

関連論文

剖検記録の音声認識のための言語モデル作成
構造を仮定しない文解釈の一手法
形態素係り受けモデルによる構文解析
単語単位による日本語言語モデルの検討
単語を認識単位とした日本語の大語彙連続音声認識
岩波国語辞典を利用した語義タグ付きテキストデータベースの作成
テキストマイニング技術を用いた企業評価分析 : 倒産企業の実証分析
語音弁別の神経機構 : 失語症患者の研究から得られたもの
失語症例の音の分離能力(クリック音融合閾)と聴覚的言語理解の関係について
開発者の視点からの機械翻訳システムの技術的評価 : テストセットを用いた晶質評価法
名詞句「AのB」「AB」の用例を利用した換喩解析
テキストにおける首尾一貫性(coherence)と文脈表現構造
機械翻訳システムCONTRASTにおける文脈情報の利用
形容詞概念抽出のための統語パタン分析 : コーパスからの日本語語彙オントロジーの構築をめざして(言語理解とオントロジーシンポジウム)
SOMを用いた日本語意味マップの自己組織化
日本語連体修飾要素の多義解消に関する語彙意味論的検討
意味ソートmsort : 意味的並べかえ手法による辞書の構築例とタグつきコーパスの作成例と情報提示システム例
文脈と対象世界モデルを利用した機械翻訳へ向けて (「機械翻訳」)
プロセス指向対話システムの提案
E_003 検索に有効な知識の自動獲得 : 質問拡張を超えて(E分野:自然言語)
Web文書集合からの専門用語獲得(自然言語,情報処理技術のフロンティア)
最大エントロピーモデルに基づく形態素解析 : 未知語の問題の解決策
最大エントロピー法に基づくモデルを用いた日本語係り受け解析
文末から解析する統計的係り受け解析アルゴリズム
MEによる日本語係り受け解析
話し言葉の接続詞「で」の特徴(自然言語)
テキストコーパスの作成 : RWC, JEIDA, Orchid
科学技術振興調整費開放的融合研究推進制度 : (小特集:) : 大規模コーパスに基づく『話し言葉工学』の構築
語義の特異性を利用した慣用表現の自動抽出
片方向の共起性による述語型定型表現の自動抽出
コーパスからの付属語的表現の自動抽出
疑似Nグラムを用いた助詞的定型表現の自動抽出
コーパスからの関係表現の自動抽出
JEIDA機械翻訳システム評価基準(品質評価編) : 英日翻訳の品質評価項目の検討と評価用コーパスの作成
機械翻訳システム CONTRAST における概念表現
文脈情報翻駅システムCONTRAST (自然言語理解)
A Natural Language Processing System with a Large Vocabulary in Secondary Storage
二次記憶上の大規模語彙を用いる自然言語処理システム
文脈処理技術 (計算言語学)
品詞の並びに関するヒューリスティックスを用いた日本語同語反復表現の検出
RWCにおける分類コード付きテキストデータベースの開発
新聞記事中の事故・事件名の自動抽出(抽出(2))
新聞記事中の事故・事件名の自動抽出(抽出(2))
異なるコーパスにおける重要文抽出の結果と素性の分析
日本におけるテストコレクションと評価の動向(情報検索システムの力くらべ : テストコレクションによる評価)
招待講演:情報検索・抽出技術の評価を巡る諸問題--第1回のNTCIR/IREXを終えて (2000年情報学シンポジウム--ネットワーク型情報メディアの活用と情報を活かす新技術) -- (セッション5:情報検索・情報抽出)
IREX :情報検索、情報抽出コンテスト
属性影響語を用いた専門用語判別(専門用語)
属性影響語を用いた専門用語判別(専門用語)
統計的に獲得された用語への属性ラベル付与(Web情報処理)
検索支援に向けたWeb文書集合からの用語獲得(Web情報処理)
統計的に獲得された用語への属性ラベル付与(Web情報処理)
検索支援に向けたWeb文書集合からの用語獲得(Web情報処理)
E-41 出現頻度を考慮した補完類似度による事象間関係の推定(知識獲得,E.自然言語・文書)
漸進的自然言語理解と概念階層
正規文法に基づく日本語形態素解析
IBM電話音声自動応答システム(音声処理技術のデモの紹介)
Webからの情報抽出・検索システムにおける全文検索(Webマイニング)(テーマ:「Webマイニングによる情報活動と自然言語処理」その他一般)
Webからの情報抽出・検索システムにおける全文検索(Webマイニング)(テーマ:「Webマイニングによる情報活用と自然言語処理」その他一般)
リストのラベルとして使われる丸括弧とリストの範囲
形式的でない表現における"ん""ちゃ""じゃ""きゃ"の接続上の性質
"「」"で括られた表現の接続と係り受けの性質
文末表現に着目した自由回答アンケートの分類
位置情報と分野情報を用いた情報検索
最大エントロピーモデルと書き換え規則に基づく固有表現抽出
知的ニュースリーダが対象とする対話型ネットニュースの特徴
知的ニュースリーダにおける表層的話題関連性の抽出
翻訳精度評価手法BLEUの日英翻訳への適用
重要文と要約の差異に基づく要約手法の調査
単語を認識単位とした日本語大語彙連続音声認識
単語を認識単位とした日本語ディクテーションシステム
人の発声単位を考慮した日本語言語モデルの検討 : 日本語における単語とは
表層的な文脈情報を用いた自然な文生成の試み
知識ベースを利用した機械翻訳システムShalt2 ( 自然言語処理の実動システム)
日本語における付属語の現れ方と規則
英日機械翻訳システムShalt2の日本語生成文法
英日機械翻訳システムShalt2における並列句の取り扱い
日本語形態素解析用文法規則の使用状況
複合語キーワードの自動抽出法
自動要約のための文重要度の比較
調理行動に伴う対機械対話収録実験
ナビゲーション対話における省略文の分析
待遇表現の丁寧さの計算モデル
LF-004 自動言い換え技術を利用した三つの英語学習支援システム(F. 人工知能)
受け身/使役文の能動文への変換における機械学習を用いた格助詞の変換
機械学習を用いたタイ語の品詞タグづけ
diffと言語処理
頻度に基づく正の例からの負の例の予測 : 日本語表現の誤り検出と外の関係の文の自動抽出
diffと言語処理
頻度に基づく正の例からの負の例の予測 : 日本語表記の誤り検出と外の関係の文の自動抽出
同義テキストの照合に基づくパラフレーズに関する知識の自動獲得
意味文脈解析 (特集自然言語処理のすべて)
情報ハイウェイ時代のテキスト情報への知的アクセス ( 情報処理最前線)
NLP2000-23 / NC2000-17 モジュール型ニューラルネットによる品詞の曖昧性解消
NLP2000-23 / NC2000-17 モジュール型ニューラルネットによる品詞の曖昧性解消
読点を伴う連体修飾の係り先
漸進的学習機能を備えた日本語形態素解析
日本語における文節間係り受け関係の統計的性質
情報科学・工学, 私はこう考える : 自然言語処理, 私はこう考える
形態的情報を使った日本語辞書情報の整備

重要文と要約の差異に基づく要約手法の調査

スポンサーリンク

概要

著者

関連論文

スポンサーリンク