連接異なり語数による専門用語抽出
スポンサーリンク
概要
- 論文の詳細を見る
1999年3月にNACSISにより主催されたNTCIRコンテストの用語抽出タスクはNACSIS論文データベースから取り出された1, 870の抄録を対象に用語を抽出するというものである。本稿で目的とするのは用語抽出タスクにおいてより高い精度の結果を出せる抽出方法の提案と実験的評価である。ここで提案する用語抽出における基本単語の順位付けのアイデアは単語がその前後に何種類の単語を連接して複合語を作るかという尺度である。この方法を複合語の順位付けに拡張した専門用語を抽出する方法を用いて、「事例の予測」「常識的な知識」のような「AのB」「形容詞+名詞」のものを用語候補とする方法、しない方法および種々のチューンアップを行なった方法について実験しNTCIRデータでの評価したところ、良好な結果を得られたので報告する。
- 2000-03-21
著者
関連論文
- 異なる発信元からのWWWニュース記事の内容に基づく対応付け
- 連接異なり語数による専門用語抽出
- 連接異なり語数による専門用語抽出
- Wikipedia を介した関連ニュース・ブログの対応付け : Wikipedia エントリの分析
- web検索に基づく多言語動的KWIC
- Latent Dirichlet Allocation における決定論的オンラインベイズ学習
- Dirichlet Process Unigram Mixture Modelに対するCollapsed Variational Bayes inferenceの適用(セッション2)
- 係り受け関係を考慮したテキストマイニングのための半構造マイニング手法の提案(言語処理,夏のデータベースワークショップDBWS 2006)
- 長時間テレビドラマのシナリオと音声トラックの時間対応付け
- 多様な携帯端末に適応可能なコンテンツ中間記述
- 多種の表示デバイスへ適応可能なコンテンツ中間表現形式の提案
- 多種の表示デバイスへ適応可能なコンテンツ中間表現形式の提案
- Comparable corpusから得られた対訳単語の曖昧性解消
- 意味保存型の情報ハイディング : 日本語文書への適用
- 意味保存型の情報ハイディング : 日本語文書への適用