重要文と要約の差異に基づく要約手法の調査
スポンサーリンク
概要
- 論文の詳細を見る
文書中から重要分を抽出する技術が開発されてきているが、人間の作成した要約とはかなりのギャップがある。我々は、人間の作成した要約の性質を知るために、新聞記事を対象に100人の被験者から自由作成の要約、重要文抽出、重要文をつなぎ合わせた要約を収集し、2種類の要約の差異に基づく調査を行なった。2種類の要約について、ツールと人手によって原文との対応付けを行ない、この対応結果から、重要文と要約での原文情報のカバーの違い、要約の原文との対応率、語順の傾向、指示詞と接続詞の使用について調べた。
- 一般社団法人情報処理学会の論文
- 2000-01-27
著者
-
荻野 紫穂
日本IBM東京基礎研究所
-
荻野 紫穂
日本アイ・ビー・エム株式会社東京基礎研究所
-
荻野 紫穂
日本ibm株式会社東京基礎研究所
-
井佐原 均
郵政省通信総合研究所関西先端研究センター知的機能研究室
-
井佐原 均
独立行政法人情報通信研究機構
-
望主 雅子
(株)リコー 情報通信研究所
-
太田 公子
独立行政法人通信総合研究所
-
太田 公子
郵政省通信総合研究所
-
井佐原 均
郵政省通信総合研究所
-
望主 雅子
(株)リコーソフトウェア研究所
-
望主 雅子
(株)リコー
関連論文
- 剖検記録の音声認識のための言語モデル作成
- 構造を仮定しない文解釈の一手法
- 形態素係り受けモデルによる構文解析
- 単語単位による日本語言語モデルの検討
- 単語を認識単位とした日本語の大語彙連続音声認識
- 岩波国語辞典を利用した語義タグ付きテキストデータベースの作成
- テキストマイニング技術を用いた企業評価分析 : 倒産企業の実証分析
- 語音弁別の神経機構 : 失語症患者の研究から得られたもの
- 失語症例の音の分離能力(クリック音融合閾)と聴覚的言語理解の関係について
- 開発者の視点からの機械翻訳システムの技術的評価 : テストセットを用いた晶質評価法
- 名詞句「AのB」「AB」の用例を利用した換喩解析
- テキストにおける首尾一貫性(coherence)と文脈表現構造
- 機械翻訳システムCONTRASTにおける文脈情報の利用
- 形容詞概念抽出のための統語パタン分析 : コーパスからの日本語語彙オントロジーの構築をめざして(言語理解とオントロジーシンポジウム)
- SOMを用いた日本語意味マップの自己組織化
- 日本語連体修飾要素の多義解消に関する語彙意味論的検討
- 意味ソートmsort : 意味的並べかえ手法による辞書の構築例とタグつきコーパスの作成例と情報提示システム例
- 文脈と対象世界モデルを利用した機械翻訳へ向けて (「機械翻訳」)
- プロセス指向対話システムの提案
- E_003 検索に有効な知識の自動獲得 : 質問拡張を超えて(E分野:自然言語)
- Web文書集合からの専門用語獲得(自然言語,情報処理技術のフロンティア)
- 最大エントロピーモデルに基づく形態素解析 : 未知語の問題の解決策
- 最大エントロピー法に基づくモデルを用いた日本語係り受け解析
- 文末から解析する統計的係り受け解析アルゴリズム
- MEによる日本語係り受け解析
- 話し言葉の接続詞「で」の特徴(自然言語)
- テキストコーパスの作成 : RWC, JEIDA, Orchid
- 科学技術振興調整費開放的融合研究推進制度 : (小特集:) : 大規模コーパスに基づく『話し言葉工学』の構築
- 語義の特異性を利用した慣用表現の自動抽出
- 片方向の共起性による述語型定型表現の自動抽出
- コーパスからの付属語的表現の自動抽出
- 疑似Nグラムを用いた助詞的定型表現の自動抽出
- コーパスからの関係表現の自動抽出
- JEIDA機械翻訳システム評価基準(品質評価編) : 英日翻訳の品質評価項目の検討と評価用コーパスの作成
- 機械翻訳システム CONTRAST における概念表現
- 文脈情報翻駅システムCONTRAST (自然言語理解)
- A Natural Language Processing System with a Large Vocabulary in Secondary Storage
- 二次記憶上の大規模語彙を用いる自然言語処理システム
- 文脈処理技術 (計算言語学)
- 品詞の並びに関するヒューリスティックスを用いた日本語同語反復表現の検出
- RWCにおける分類コード付きテキストデータベースの開発
- 新聞記事中の事故・事件名の自動抽出(抽出(2))
- 新聞記事中の事故・事件名の自動抽出(抽出(2))
- 異なるコーパスにおける重要文抽出の結果と素性の分析
- 日本におけるテストコレクションと評価の動向(情報検索システムの力くらべ : テストコレクションによる評価)
- 招待講演:情報検索・抽出技術の評価を巡る諸問題--第1回のNTCIR/IREXを終えて (2000年情報学シンポジウム--ネットワーク型情報メディアの活用と情報を活かす新技術) -- (セッション5:情報検索・情報抽出)
- IREX :情報検索、情報抽出コンテスト
- 属性影響語を用いた専門用語判別(専門用語)
- 属性影響語を用いた専門用語判別(専門用語)
- 統計的に獲得された用語への属性ラベル付与(Web情報処理)
- 検索支援に向けたWeb文書集合からの用語獲得(Web情報処理)
- 統計的に獲得された用語への属性ラベル付与(Web情報処理)
- 検索支援に向けたWeb文書集合からの用語獲得(Web情報処理)
- E-41 出現頻度を考慮した補完類似度による事象間関係の推定(知識獲得,E.自然言語・文書)
- 漸進的自然言語理解と概念階層
- 正規文法に基づく日本語形態素解析
- IBM電話音声自動応答システム(音声処理技術のデモの紹介)
- Webからの情報抽出・検索システムにおける全文検索(Webマイニング)(テーマ:「Webマイニングによる情報活動と自然言語処理」その他一般)
- Webからの情報抽出・検索システムにおける全文検索(Webマイニング)(テーマ:「Webマイニングによる情報活用と自然言語処理」その他一般)
- リストのラベルとして使われる丸括弧とリストの範囲
- 形式的でない表現における"ん""ちゃ""じゃ""きゃ"の接続上の性質
- "「」"で括られた表現の接続と係り受けの性質
- 文末表現に着目した自由回答アンケートの分類
- 位置情報と分野情報を用いた情報検索
- 最大エントロピーモデルと書き換え規則に基づく固有表現抽出
- 知的ニュースリーダが対象とする対話型ネットニュースの特徴
- 知的ニュースリーダにおける表層的話題関連性の抽出
- 翻訳精度評価手法BLEUの日英翻訳への適用
- 重要文と要約の差異に基づく要約手法の調査
- 単語を認識単位とした日本語大語彙連続音声認識
- 単語を認識単位とした日本語ディクテーションシステム
- 人の発声単位を考慮した日本語言語モデルの検討 : 日本語における単語とは
- 表層的な文脈情報を用いた自然な文生成の試み
- 知識ベースを利用した機械翻訳システムShalt2 ( 自然言語処理の実動システム)
- 日本語における付属語の現れ方と規則
- 英日機械翻訳システムShalt2の日本語生成文法
- 英日機械翻訳システムShalt2における並列句の取り扱い
- 日本語形態素解析用文法規則の使用状況
- 複合語キーワードの自動抽出法
- 自動要約のための文重要度の比較
- 調理行動に伴う対機械対話収録実験
- ナビゲーション対話における省略文の分析
- 待遇表現の丁寧さの計算モデル
- LF-004 自動言い換え技術を利用した三つの英語学習支援システム(F. 人工知能)
- 受け身/使役文の能動文への変換における機械学習を用いた格助詞の変換
- 機械学習を用いたタイ語の品詞タグづけ
- diffと言語処理
- 頻度に基づく正の例からの負の例の予測 : 日本語表現の誤り検出と外の関係の文の自動抽出
- diffと言語処理
- 頻度に基づく正の例からの負の例の予測 : 日本語表記の誤り検出と外の関係の文の自動抽出
- 同義テキストの照合に基づくパラフレーズに関する知識の自動獲得
- 意味文脈解析 (特集 自然言語処理のすべて)
- 情報ハイウェイ時代のテキスト情報への知的アクセス ( 情報処理最前線)
- NLP2000-23 / NC2000-17 モジュール型ニューラルネットによる品詞の曖昧性解消
- NLP2000-23 / NC2000-17 モジュール型ニューラルネットによる品詞の曖昧性解消
- 読点を伴う連体修飾の係り先
- 漸進的学習機能を備えた日本語形態素解析
- 日本語における文節間係り受け関係の統計的性質
- 情報科学・工学, 私はこう考える : 自然言語処理, 私はこう考える
- 形態的情報を使った日本語辞書情報の整備