抽出パターンの階層的照合に基づく日本語テキストからの内容抽出法
スポンサーリンク
概要
- 論文の詳細を見る
テキストから情報を抽出する処理として,辞書的情報に頼らない未知語に強い内容抽出処理を提案する.具体的には,任意の文字列と一致するワイルドカード項から構成される抽出パターン (文脈自由型文法に属する) と入力文字列との階層的な照合を行うことによって抽出する.ワイルドカード項に対応する文字列は,前後の項の制約で決まる.これを利用し,未知語が予想される部分に対してはワイルドカード項で表現する.製品紹介記事約300文を訓練データとして用い,抽出パターンの作成および改良を行い,約98%の抽出成功率を得た.この抽出パターンを用いて,非訓練データ109文に対し抽出実験を行った結果,約86%の抽出成功率が得られた.256単語相当の辞書的情報と178個のパターンで,このような高い抽出成功率が得られ,本方法が未知語に強く実用的にも有効な方法であることを明らかにした.
- 1995-08-15
著者
関連論文
- 日本語情報検索システム評価用テストコレクションの構築
- 日本語情報検索システム評価用テストコレクション BMIR-J2
- 統計的手法による辞書未登録語の獲得法
- マウスによる仮想折り紙の対話的操作のための計算モデルとインタフェース(コンピュータグラフィックス,インタラクションの理解とデザイン)
- 相関ルールの視覚化によるデータマイニング支援方式
- 検索キーの文章定義による日本語対話処理 : 文章間の意味的照合によるユーザ入力支援
- 情報検索システム評価用ベンチマークVer.1.0(BMIR-J1)について (メディア統合および環境統合のための高機能データベースシステム、および一般)
- 日本語情報検索システムのためのベンチマークの構築
- 情報検索システム評価用データベースの構築の提案
- 検索対象テキストDB自動決定法の検討
- 特徴要素別にカテゴリ-選択を行う高速パタ-ン照合法
- 相関ルールの視覚化によるデータマイニング支援方式
- 日本語情報検索システム評価用テストコレクションの構築 (『1998年情報学シンポジウム』プログラム--WWW情報検索・電子図書館・セキュリティ・著作権・マルチメディア情報流通・感性情報処理) -- ((セッション7)情報検索と知識獲得)
- 統計的手法によるテキストからの重要語抽出メカニズム
- D01 六書原理に基づくロゴデザインシステム(グラフィックデザイン、タイポグラフィ, 第54回研究発表大会)
- D18 視覚伝達デザインにおける漢字図形化について(グラフィックデザイン,口頭による研究発表概要,平成18年度 日本デザイン学会 第53回研究発表大会)
- 重要概念抽出に基づく新聞記事からのキーワード作成
- オブジェクトに基づく高速画像検索システム : ExSight
- 自動部分構造化に基づくインデクシングによる大容量画像検索システム
- 感性語による画像検索とその精度評価
- 感性語とカラーパターン対応テーブルを用いた画像の感性検索
- インタラクティブ多方向情報表示システム
- 抽出パターンの階層的照合に基づく日本語テキストからの内容抽出法
- 動的シソーラスを用いた連想検索 : リンク重みの導入
- 日本語テキストデ-タベ-ス検索分類技術 (自然言語処理技術の研究)
- 日本語新聞記事からのキ-ワ-ド自動抽出と重要度評価 (新しいデ-タベ-ス技術論文特集)
- 日本語対話処理のためのユーザ入力支援
- 意味属性に基づくテキストベース検索方式
- 意味属性に基づくテキストベース検索処理
- 抽出パターンの階層的照合に基づく内容抽出法
- 文字相互の接続関係を用いた文字認識高速化の検討
- 特徴要素別に候補選択を行う文字パタン照合の並列処理法
- 自然画像から抽出したオブジェクト画像を利用した感性語による画像検索システム(画像デザイン)