複合語キーワードの自動抽出法
スポンサーリンク
概要
- 論文の詳細を見る
本稿では,複合語キーワード抽出法を報告する.従来方式では,(1)単語単位にキーワード性を判定し,キーワードと判定された単語の連続部分を複合語としていたため,複合語の範囲を正しく認定できなかった.(2)キーワード性を品詞に基づいて判定していたため,キーワードの抽出精度が低かった.これらの問題点を解決するため,(1)抽出する複合語の記述に正規表現を導入し,この正規表現にマッチする単語の連続部分を複合語と判定する.(2)品詞を補って単語の構文的・意味的性質を記述するキーワード素性を導入し,前後の単語の性質を考慮してキーワード性を評価する.その結果,複合語の範囲を正しく認定し,キーワード抽出精度を向上させることができた.
- 一般社団法人情報処理学会の論文
- 1993-09-16
著者
-
小川 泰嗣
(株)リコー中央研究所
-
小川 泰嗣
(株)リコー ソフトウェア研究所
-
小川 泰嗣
(株)リコー情報通信研究所
-
望主 雅子
(株)リコー 情報通信研究所
-
別所 礼子
(株)リコー情報通信研究所
-
望主 雅子
(株)リコー情報通信研究所
-
望主 雅子
(株)リコー
関連論文
- D-013 構造化コンテンツにズーミング操作を関連付ける記述言語の提案(D分野:データベース)
- 日本語情報検索システム評価用テストコレクションの構築
- 日本語情報検索システム評価用テストコレクション BMIR-J2
- 2ウェイマージ機能を有するオメガネットワーク
- データストリームマージ機能をもつオメガネットワーク
- D-007 ズーミングメタファによるマルチメディアコンテンツの閲覧方式(D.データベース)
- スーパーデータベースコンピュータSDCのモジュール間ネットワークにおけるスイッチングユニットの構成
- スーパーデータベースコンピュータSDCにおけるバケット平坦化機能を有するオメガネットワーク
- バケット平坦化機能を有するオメガネットワーク
- スーパーデータベースコンピュータにおけるバケット分散並列結合演算法とその性能予測
- プロセス指向対話システムの提案
- 情報検索システム評価用ベンチマークVer.1.0(BMIR-J1)について (メディア統合および環境統合のための高機能データベースシステム、および一般)
- 日本語情報検索システムのためのベンチマークの構築
- 情報検索システム評価用データベースの構築の提案
- N-gram索引における複合検索条件の効率的な処理方法
- n-gram索引を用いた効率的な文書検索法 (高度データベース論文特集)
- ランキング文書検索におけるスコア合成法の評価
- 統計的確率に基づくキーワード重要度算出モデル
- 統計的確率に基づくキーワード重要度算出モデル
- 全文検索のための文字成分表方式の改良
- 関係データベースによる構造化文書データベースの実現
- テキストデータベースのための文字成分表によるプリサーチ
- 参加者から見たNTCIR(NTCIR : 情報アクセスに関わるテキスト処理技術の評価ワークショップ)
- 「情報検索の新たな展開 : テストコレクションからサーチエンジンまで」
- O-017 情報の整理に焦点をあてたフォーラムシステム(O.情報システム)
- 文書検索におけるランキング検索技術
- 適合フィードバックを利用したクウェリ拡張における単語選択方法
- 適合フィードバックを利用したクウェリ拡張における単語選択方法
- 擬似頻度法 : n-gram索引のための高速な日本語文書のランキング検索法
- N-gram索引における複合検索条件の効率的な処理方法
- 文字成分表を用いた効率的文書ランキング検索方式
- 日本語文書検索のための頻度情報を用いた効率的部分文字列索引の提案
- 動的リンク機能を有するハイパーテキストシステム
- ファジィ文書検索システム(2) : キーワードコネクションマトリックスの学習方式
- ファジィ文書検索システム(1) : 実験システムと評価
- 重要文と要約の差異に基づく要約手法の調査
- 複合語キーワードの自動抽出法
- テキストデータベースのための文書ランキング法
- テキストデータベースのためのキーワード抽出法
- 調理行動に伴う対機械対話の発話現象
- 調理行動に伴う対機械対話収録実験
- ナビゲーション対話における省略文の分析
- 文テンプレートによる発話文認識
- 文テンプレートによる文認識方法
- テキスト音声合成における係り受け解析結果を用いたポーズ挿入処理
- 岡田美智男 著 情報処理学会 編 "口ごもるコンピュータ" : 情報フロンティアシリーズ(9) : 共立出版, 179p
- 名詞句に着目した特定アプリケーションの発話現象