統計的手法によるテキストからの重要語抽出メカニズム
スポンサーリンク
概要
- 論文の詳細を見る
本論文では字面処理によって,テキストから重要語(キーワード)を自動抽出する方法について述べる.日本語の場合まず文章から単語を得るために,形態素解析が必要であるが,形態素解析には未知語や曖昧性の解消などの問題があり,これを解決するために,従来は複雑な規則や人間がメンテナンスしなければならない辞書が必要であった.本手法はNグラムの頻度情報を用いた完全な字面処理になっている.その手順では(1)まずNグラム頻度情報を使って重要な文字列を抽出し,(2)次にその中から無意味な文字列を排除する.実験ではこの手法が未知語や複合語の範囲を正しく識別し,抽出精度を向上させることを確認した.
- 一般社団法人情報処理学会の論文
- 1995-09-14
著者
関連論文
- 日本語情報検索システム評価用テストコレクションの構築
- 日本語情報検索システム評価用テストコレクション BMIR-J2
- 統計的手法による辞書未登録語の獲得法
- マウスによる仮想折り紙の対話的操作のための計算モデルとインタフェース(コンピュータグラフィックス,インタラクションの理解とデザイン)
- 情報検索システム評価用ベンチマークVer.1.0(BMIR-J1)について (メディア統合および環境統合のための高機能データベースシステム、および一般)
- 日本語情報検索システムのためのベンチマークの構築
- 情報検索システム評価用データベースの構築の提案
- 検索対象テキストDB自動決定法の検討
- データ項目名等の意味解析による概念モデルの作成法
- 日本語情報検索システム評価用テストコレクションの構築 (『1998年情報学シンポジウム』プログラム--WWW情報検索・電子図書館・セキュリティ・著作権・マルチメディア情報流通・感性情報処理) -- ((セッション7)情報検索と知識獲得)
- 双方向マルチメディア通信可能なWWW上でのCAIシステム
- 統計的手法によるテキストからの重要語抽出メカニズム
- 検索者とサーバーの協調によるWWW情報検索サーバーの性能改善に関する考察
- 正規化頻度による形態素境界の推定
- 正規化頻度による形態素境界の推定
- 統計的手法による分かち書き境界の獲得
- 統計的手法によるテキストからのキーワード抽出法
- スキーマ統合におけるスキーマ要素間の類似性発見手法
- データ項目名等の意味解析による既存のDB中の実体型抽出アルゴリズム
- D01 六書原理に基づくロゴデザインシステム(グラフィックデザイン、タイポグラフィ, 第54回研究発表大会)
- D18 視覚伝達デザインにおける漢字図形化について(グラフィックデザイン,口頭による研究発表概要,平成18年度 日本デザイン学会 第53回研究発表大会)
- 重要概念抽出に基づく新聞記事からのキーワード作成
- オブジェクトに基づく高速画像検索システム : ExSight
- 自動部分構造化に基づくインデクシングによる大容量画像検索システム
- 感性語による画像検索とその精度評価
- 感性語とカラーパターン対応テーブルを用いた画像の感性検索
- インタラクティブ多方向情報表示システム
- 抽出パターンの階層的照合に基づく日本語テキストからの内容抽出法
- 動的シソーラスを用いた連想検索 : リンク重みの導入
- 日本語テキストデ-タベ-ス検索分類技術 (自然言語処理技術の研究)
- 日本語新聞記事からのキ-ワ-ド自動抽出と重要度評価 (新しいデ-タベ-ス技術論文特集)
- 自然画像から抽出したオブジェクト画像を利用した感性語による画像検索システム(画像デザイン)