テキストの概要把握支援のための話題構造抽出
スポンサーリンク
概要
- 論文の詳細を見る
ユーザがテキストの概要の直感的な把握を容易に行えるような環境を実現するために, 話題構造を自動的に抽出する方法を提案する. 我々の方法は, 話題構造を読み手にうまく伝えるために, 書き手が意識的あるいは無意識に用いる言語現象を規則化することにより, 話題構造を抽出する. 言語現象としては, タイトルや章立て, 段落のような文書の論理構造,「まず」や「次に」などの手掛かり句, 疑問表現, 段落の長さ,「に関して」や「が」のような話題マーカ連体修飾関係, 固有名詞などの品詞情報を用いた. これらは非常に汎用的であるので, 我々の方法は新聞記事や技術文書はいうまでもなく, 電子メイルなどの多種多様なテキストにも適用することができる. 現実のテキストに対して人間と我々のシステムが抽出した話題構造を比較する評価実験を行った結果, 構造を考慮した話題スコープの評価で再現率が59.4%, 適合率が59.1%であった. これは, 概要把握という目的のために人間が利用できる精度である. さちに, 現実のテキストを扱う際に避けられない未知語の問題に対しても検討を行い, 1つのテキストに含まれる未知語の数が多くない場合は, 我々の方法は精度を落とさないという見通しも得た.
- 社団法人情報処理学会の論文
- 1996-11-15
著者
-
竹下 敦
Ntt北海道法人営業本部
-
井上 孝史
日本電信電話株式会社NTTサイバーソリューション研究所
-
井上 孝史
Nttヒューマンインタフェース研究所
-
田中 一男
NTTヒューマンインタフェース研究所
関連論文
- ソーシャルブックマークにおけるタグ付与行動に基づくスパマー判別
- 目的指向型ブログ検索システムBLOGRANGERの提案およびユーザ評価
- ソーシャルブックマークユーザのタグ付与行動に基づくスパマー判別手法(ウェブ情報とデータベースに関して(ポスター講演))
- マルチファセット型ブログ検索システムBLOGRANGERの開発(オフィスインフォメーションシステム及び一般)
- WWW検索ログに基づく情報ニーズの抽出
- 情報潮流抽出のための分類精度の改善手法について
- 絞り込み検索語候補の抽出に関する一検討
- トレンド・アウェアネスのための情報潮流の抽出
- 追加検索語候補提示に関する一検討
- 検索結果の文献集合を視覚的に提示するインタフェースの提案
- WWW検索ログに基づくトレンド情報の抽出について
- 情報分類を用いたトレンド・アウェアネスの支援
- InfoBeeマルチメディア速覧技術 (特集論文 InfoBee情報資源活用技術)
- InfoBeeテキスト情報検索技術 (特集論文 InfoBee情報資源活用技術)
- モバイル端末の表示特性に応じたメッセージ要約方式の提案
- InfoBeeテキスト速覧技術 (特集論文 InfoBee情報資源活用技術)
- テキストの概要把握支援のための話題構造抽出
- モノローグに対するブラウジング支援のための話題構造抽出
- フルテキスト検索でのインタラクションに関する一検討
- テキストに対する速覧インタフェース
- 情報資源の内容に基づく検索に関する一検討
- モノローグにおける話題導入部の検出
- 人間の認識特性に基づく時事情報からの情報抽出
- 4ZB-1 インターネットポータルにおけるイベントマッチング・カレンダーサービスの検討(情報/知識共有,一般講演,インタフェース)
- 5S-2 共有メモリを利用したメガインタラクション検索サーバ
- 分散型大規模文書検索システムに関する一検討
- 4D-3 JoiNet双方向インタラクティブTV番組実験
- 1C-8 大量情報配信システム VideoDome/InterDome
- 4N-3 アンケートを対象としたテキスト自動分類システムの検討
- 2N-6 情報構造に基づく文意味計算方式の提案
- 4G-4 歌詞がメロディと和音に与える影響の検討
- 4P-10 大規模並列全文検索エンジンの実装と高度化の検討
- 3P-2 リンクの共起関係を用いたWebページ分類方式の検討
- 5Q-8 パケット長を考慮したストリーム分割伝送方式の検討
- 3Q-9 展示会場向けモバイル情報流通システム[MOCHA MIX]の構築と評価
- 3P-4 インターネット・アクセス・トラヒック制御技術TelePolling : システム構築のためのアプリケーション・インタフェース
- 3P-3 インターネット・アクセス・トラフィック制御技術TelePolling : アクセス履歴情報を用いた制御の精密化の検討
- 3U-5 問合せ回答型文書集合における類似事例抽出方法の一検討
- 3U-1 レイアウトに着目したメールマガジンからの話題抽出方式
- 1U-4 日本語の表現特性を利用したテキスト情報検索システムの検討
- 3G-3 歌謡曲における歌詞 : メロディ間の関係の抽出
- goo/InfoBeeが目指す自然言語処理
- 歌詞からラララ--言葉から歌への自動変換 (ことば工学研究会(第3回)テーマ:"認知科学会「文学と認知・コンピュータ」研究分科会"との合同研究会)
- JoiNet情報流通サービスシステムの研究開発 (特集 JoiNet情報流通システム技術)
- 問合せ・回答型テキストを対象とするテキスト情報検索の一方式
- 疑似カテゴリ生成によるテキスト自動分類の高速化について
- 話題が混在するテキストからの話題セグメント抽出方式
- テキスト情報に基づくビデオ映像の構造化ブラウザ
- WW検索ログに基づく情報ニーズ傾向の把握
- 複数端末への同時配信によるWebコンテンツの連続的表示方法
- 情報流通向けテキストコンテンツ要約手法について
- 類似意味内容の統合による伝達型電子化文書要約方式の提案
- 話題構造および文意味構造に基づく文書可視提示方式の提案
- 与えられた日本語文を歌詞とする自動楽曲生成システム
- InfoBeeフルテキスト検索システムにおけるインデキシング方式の検討
- 柔軟な対話システムの試み
- マルチキャストデータ配信を用いた大規模インターネット・イベントシステム
- IPマルチキャストストリーム分散伝送方式の一検討
- TeleCollection大規模データ集約システム : 先行予測型発呼制御
- PDCによるパケット通信と回線通信を組み合わせたモバイル情報配信方式の検討
- モバイル情報流通機構MOCHAによる情報配送方式の検証
- モバイル情報流通機構MOCHAの提唱 : コンセプト, 構造とサービス
- 車両向けモバイル情報提供システム[MOCHA-Navi]のサービス実験
- 展示会のための情報流通システムの提案
- MOCHAにおけるリアルタイム情報配送方式の検討
- モバイル環境を考慮した情報流通機構MOCHA
- MOCHAにおける情報獲得・提示方式の検討
- 展示会場向けモバイル情報流通システム[MOCHA MIX]における位置・行動把握方式の検討