新聞記事からの用語集作成のためのテキスト分析
スポンサーリンク
概要
- 論文の詳細を見る
新聞記事では、読者にとって未知の情報であっても、その内容がわかるように新語には定義や説明などが定型的な表現で記述されることが多い。我々は、このような定型表現を利用し、記事に含まれる語の定義、解説、性質に関する説明などの情報を抽出し、用語集の自動構築ができないかと考えている。抽出のための定型表現としては、係助詞「は」の題目提示機能による題目文を利用することが考えられるが、「は」は他にも多くの機能を持つため、題目文を絞り込むための制約条件が問題となる。国語学的知見から、「αはβ」の題目文に対する表層の条件を定義するのが難しいことは明らかである。そこで、本稿では分析結果から、(1)題目以外の「αはβ」文を定義するパターンを与えることで題目文を絞り込める、さらに絞り込んだ結果を分析することにより、(2)性質、説明などを表す表層の条件から、百科事典的な記述を含む文に絞り込める、という知見を得ることができた。本稿では、この分析過程および結果を中心に報告する。
- 一般社団法人情報処理学会の論文
- 1999-11-25
著者
-
乾 裕子
計量計画研究所
-
西野 文人
富士通研究所
-
落谷 亮
富士通研究所
-
木田 敦子
計量計画研究所
-
落谷 亮
(株)富士通研究所
-
木田 敦子
(財)計量計画研究所
-
西野 文人
富士通研
-
西野 文人
富士通研究開発中心
-
西野 文人
富士通研究所ソフトウェア研究部
-
西野 文人
(株)富士通研究所 コンピュータシステム研究所 ドキュメント処理研究部
関連論文
- 格情報を制約条件とした動詞階層化の試み
- Webアノテーション技術を用いたコンテクストによる情報整理方式の提案(セッション情報の構造化/整理)
- 語構成論に基づいたサ変動詞の分類
- ソーシャルな情報再構成による情報共有システムの提案
- スケジュール情報からのインフォーマルコミュニティ抽出(セッション1: コミュニティー支援・コミュニケーション支援)
- スケジュール情報からのインフォーマルコミュニティ抽出(セッション1: コミュニティー支援・コミュニケーション支援)
- トップダウンなパターン解析に基づく情報抽出
- 文書中の情報を整理する情報抽出技術 (特集 電子図書館を支える技術)
- 検索ログからの話題抽出に向けて : サイト種別の自動判定の試み (情報処理学会 情報学基礎研究会(FI) 第69回 発表論文)
- 検索ログからの話題抽出に向けて : サイト種別の自動判定の試み