抽出パターンの階層的照合に基づく内容抽出法
スポンサーリンク
概要
- 論文の詳細を見る
テキストから情報を抽出する処理として,辞書的情報に頼らない未知語に強い内容抽出処理を提案する.具体的には,任意の文字列と一致するワイルドカード項を含む複数種類の項から構成される抽出パターン(文脈自由型文法に属する)と入力文字列との階層的な照合を行うことによって抽出する.ワイルドカード項に対応する文字列は,前後の項の制約で決まる.これを利用し,未知語が予想される部分に対してはワイルドカード項で表現する.製品紹介記事に対して,抽出実験を行った結果,訓練用データ約98%,非訓練用データ約84%の抽出成功率が得られ,本方法の有効性が確認された.
- 一般社団法人情報処理学会の論文
- 1994-01-20
著者
関連論文
- 相関ルールの視覚化によるデータマイニング支援方式
- 検索キーの文章定義による日本語対話処理 : 文章間の意味的照合によるユーザ入力支援
- 検索対象テキストDB自動決定法の検討
- 特徴要素別にカテゴリ-選択を行う高速パタ-ン照合法
- 相関ルールの視覚化によるデータマイニング支援方式
- 抽出パターンの階層的照合に基づく日本語テキストからの内容抽出法
- 日本語対話処理のためのユーザ入力支援
- 意味属性に基づくテキストベース検索方式
- 意味属性に基づくテキストベース検索処理
- 抽出パターンの階層的照合に基づく内容抽出法
- 文字相互の接続関係を用いた文字認識高速化の検討
- 特徴要素別に候補選択を行う文字パタン照合の並列処理法