構文情報を用いたキーワード抽出
スポンサーリンク
概要
- 論文の詳細を見る
従来のキーワード抽出手法は、文書を解析することによって自立語を切り出し、それらを独立に扱うことで効率的な検索を実現してきた。しかし、このような手法では、意味的な観念が陽に考慮されないため、重要でない語もキーワードとして抽出されてしまう。その結果、これらのキーワードを用いて検索する際に、重要でない文書も検索されてしまう問題が生じる。本稿では、検索対象を構文解析することによって得られる語の係り受け関係、否定、時制といった構文情報を用いて、キーワードであるかどうかを評価し、重要なキーワードを選別する手法を提案する。構文解析は、会話型パーザJAWBを用い、正解を教えることで解析を行った。解析結果は、文節間の係り受け関係を表す木構造として得られる。また、構文情報に加え、語の意味分類として、分類語彙表を用いた。同様な研究に木本の研究がある。我々の手法は、構文解析を行うことで、係り受け関係や、より一般的な構文属性も考慮した。また、その重み付けを事例ベースから計算する手法を用いた。
- 一般社団法人情報処理学会の論文
- 1992-09-28
著者
-
野美山 浩
日本アイ・ビー・エム株式会社東京基礎研究所
-
原田 隆史
慶應義塾大学
-
諸橋 正幸
日本アイ・ビー・エム(株)東京サイエンティフィック・センター
-
細野 公男
慶應義塾大学 文学研究科
-
細野 公男
慶應義塾大学
-
原田 隆史
慶應義塾大学文学部図書館・情報学専攻
-
関根 さゆり
日立製作所
-
梅田 栄廣
日本電気
-
細野 公男
慶大
-
細野 公男
慶應義塾大学文学部図書館・情報学科
-
細野 公男
慶応大学図書館情報学科
-
野美山 浩
日本アイ・ビー・エム 東京基礎研
-
諸橋 正幸
日本アイ・ビー・エム株式会社東京基礎研究所
-
諸橋 正幸
日本アイ・ビー・エム(株)サイエンス・インスティチュート
関連論文
- オンライン書評と従来の書評との違いの分析
- FRBRと集合知を利用した図書館システム仕様の策定(一般発表)
- レファレンス事例に対するキーワードの自動付与(セッション3:キーワード付与)
- 大規模日本語テキストからの依存構造の抽出
- 強化後間隔によるビデオゲームの面白さの測定(日本基礎心理学会第25回大会,大会発表要旨)
- 書評中の語を用いた図書に対する感性パラメータ自動設定の最適化(第17回(2009年度)年次大会(研究報告会&総会))
- 書評を用いた図書に対する感性パラメータの自動設定(創立20周年記念 第16回(2008年度)年次大会(研究報告会&総会))
- データベース照会システム「ヤチマタ」と名詞句データ模型
- オンライン書評と従来の書評との違いの分析
- 複合語の解析による語の上位一下位関係の自動構築
- 英米におけるIS研究・教育の動向
- 電気工学分野と周辺諸分野との関連度の分析 : ディスクリプタの出現頻度に基づいて
- レファレンスデータに対するNDCの自動付与(第15回(2007年度)年次大会(研究報告会&総会))
- 情報検索システムにおける効果的なナビゲーション機能の提案
- 電子図書館IV : ナビゲーションシステムプロトタイプ
- 電子図書館III : Information Outlining : 触ってわかる情報の輪郭
- 電子図書館II : 基本設計
- 電子図書館I : 将来像
- 図書館の資料提供サ-ビスに与えるオンライン検索の影響
- オンライン情報検索が冊子体購入に与える影響
- 第21回専門用語研究部会特別討論会報告
- 専門用語概論ターミノロジー, 仲本秀四郎著, 東京, 日本図書館協会, 2005年10月15日, B5., 93p., ISBN4-8204-0523-3, 定価: 1,050円(本体: 1,000円)
- ISO/TC37(ターミノロジー)における活動とその将来動向(情報知識学会 専門用語研究部会主催 : 第13回専門用語研究シンポジウム)
- 概念間の全体-部分関係に関する一考察 (「第12回専門用語研究会シンポジウム:東アジアにおける専門用語研究の新しい動向」から)
- コーパスからの対訳辞書の半自動生成
- Webアーカイブの仕組みと技術的な特徴(Webアーカイビングの現状と課題)
- 抄録からのキーワードの自動抽出
- 抄録からのキーワードの自動抽出
- 抄録からの主題文の自動抽出
- 構文情報を用いたキーワード抽出
- 図書館業務におけるOAとは (OA機器と図書館)
- ir会議 (日経MIX) (特集 : パソコン通信とヒューマンネットワーク)
- レファレンス事例に対するキーワードの自動付与(セッション3:キーワード付与)
- サイト・アウトライニング : インターネットからの情報収集と可視化技術
- テキスト情報の可視化を利用した情報検索(「ビジュアルな情報検索」編集にあたって)
- 「情報検索の新たな展開 : テストコレクションからサーチエンジンまで」
- 情報処理専門教育について 大学等における情報系専門教育の改善への提言
- 総説:ITがもたらした情報環境の変化
- 解説 図書館からみたナレッジ・マネージメント
- 電子図書館における検索 (創立40周年記念特集号) -- (特集 電子図書館とマルチメディア・ネットワ-ク)
- 知的情報システムへの道-5-システム志向から情報要求者志向へ
- 漢字の出現頻度特性を用いた日本語文献の機械処理
- 情報文化とは何か?
- Webで公開されている条例を対象としたデジタルアーカイブ(デジタルアーカイブの応用,テーマ : 「デジタルアーカイブの活用(応用)」および一般)
- Webで公開されている条例を対象としたデジタルアーカイブ(デジタルアーカイブの応用,テーマ : 「デジタルアーカイブの活用(応用)」および一般)
- デジタルコレクションの構築とその課題(資料のデジタル画像化と保存)
- 強化後間隔はゲームを魅力的なものにしているのか(日本基礎心理学会第24回大会,大会発表要旨)
- インターネット経由で DIALOG を検索する際の利用者インターフェース : 適合度順出力機能を中心として
- FRBRモデルを前提とする集中型目録と分散型目録の連携手法の検討
- レファレンス記録に対するキーワードの自動付与(単語・語彙(II))
- 最適解の付与に基づく重み付けの自動変更(第14回(2006年度)年次大会(研究報告会&総会))
- 表現と関係の面からみた情報検索の課題(情報知識学会創立20周年記念特別号)
- 三訂 情報検索演習, 原田智子編著他, 東京 樹村房, 2006.10, 21cm×15cm, 203p, ISBN: 4-88367-131-3, 定価1,995円(税込み)
- 溝口理一郎, 『オントロジー工学』, オーム社, 2005, 275p.
- 斉藤 孝著, 『「記録・情報・知識」の世界 オントロジ・アルゴリズムの研究』, 中央大学出版部, 2004, A5, 344p., 3,150円, ISBN:4-8057-6149-0
- 会長に就任して
- INFOSTA Forum 第136回 ターミノロジーのすすめ
- デジタル化の方向とその意義
- 情報知識学会・第7回(1999年度)研究会報告会
- 会議の概要 ( ベルリン会議)
- 情報検索の高度化に向けて : 第19回ドクメンテーション・シンポジウム発表内容
- 自動索引 : 索引作業高度化の観点から(インデクシング(索引作成)の方法(8)(最終回))
- より人間的な情報検索システムの構築をめざして(21世紀の光の中へ)
- 斎藤 孝, パソコンRDBMS入門 : 代表的パソコンRDBMSの事例中心に(CQ Red Backs No.2), 東京, CQ出版社, 1984, A5, 211p., \1,700
- Lancaster F. W., Toward Paperless Information Systems., New York, Academic Press, 1978., xii, 197p., (Library and Information Science Series), ISBN 0-12-436050-5 \3,640
- JSIAIワークステーション(4) : 日本語ユーザモニター
- 個人適応型情報検索システム : 個人の興味を学習する階層記憶モデルとその協調的フィルタリングへの適用
- 電子書籍フォーマットの動向と学術情報流通への課題
- 概念間の関係に関する一考案 : 全体-部分関係を中心に(< : 小特集>「情報学」)
- The University Licensing Program (TULIP) : プロジェクト最終報告書(8)
- テキストデータを用いた問題の早期発見手法(意味表現・データマイニング)
- 消失や改変されたWebページの分析(第13回(2005年度)研究報告会講演論文集)
- 「ことだま」文書処理システムの文節わかち書き仮名漢字変換
- 新聞記事データベースからの話題の抽出II-話題の構造の解析
- 新聞記事データベースからの話題の抽出
- 情報量から見た自然言語処理システムに対する考察
- 漸進的学習機能を備えた日本語形態素解析
- テキストからの知識獲得支援ツール
- テキストマイニング : 膨大な文書データからの知識獲得 : 概要
- テキストマイニング : 膨大な文書データからの知識獲得 : 意図の認識
- The University Licensing Program (TULIP) : プロジェクト最終報告書(7)(Z39.50)
- The University Licensing Program (TULIP) プロジェクト最終報告書(6)
- The University Licensing Program (TULIP) プロジェクト最終報告書(5)
- The University Licensing Program (TULIP) : プロジェクト最終報告書(4)
- The University Licensing Program (TULIP) プロジェクト最終報告書(3) (インターネットのおとし穴)
- The University Licensing Program (TULIP) プロジェクト最終報告書(2)
- 連載:The University Licensing Program (TULIP) プロジェクト最終報告書(1)
- 索引作業の今日的特徴と課題 (統制索引語に未来はあるか?)
- 第47回FID大宮大会を終って (第47回FID東京大会あれこれ)
- 9. 情報システム人材の教育体系の確立について ( ネット指向パラダイムを求めて)
- 全体会1 多様化の波に直面する専門図書館の課題(基調講演) (平成3年度〔専門図書館協議会〕全国研究集会)
- 異種データに対する統合的情報検索
- Information Outlining : 検索情報の可視化 行政情報の活用のために
- 自立語辞書依存の少ない日本語文の形態素解析
- IBMプロフェッショナル論文 コールセンターのログデータを用いた製品等の不具合の早期発見
- 情報獲得のパラダイムとしてのInformation Outlining (「1997年情報学シンポジウム」プログラム--人と情報学の調和をめざして) -- (マルチメディア技術2(情報の高度利用に向けて))
- 事例の一般化による機械翻訳
- 感性語をもとにした読書支援システム
- 自動索引付け研究の動向
- 漢字の出現頻度特性を用いた日本語文献の機械処理