時系列情報を利用した複合語キーワードの抽出(抽出,コーパス)
スポンサーリンク
概要
- 論文の詳細を見る
テキストマイニングなどのテキスト分析では、名詞などをキーワードとして分析の単位としている。我々は分析の一つの概念と見なせるこの単位をMining Conceptと呼んでいる。Mining Conceptはその定義によってテキスト分析の結果に大きく影響する。我々は今回、Mining Conceptの一つの種類として時系列発生的Mining Concept(FOMIC)を定義した。FOMICとは、文書内で名詞の複合語を形成している単語群で、各々の単語頻度の時系列推移が同期しているものである。このMining Conceptは、話題の時間推移に同期しているといえる。本論文では、我々の定義したFOMICの抽出方法を示し、その有効性を議論する。
- 一般社団法人情報処理学会の論文
- 2006-03-27
著者
関連論文
- 形態素係り受けモデルによる構文解析
- テキストマイニング技術を用いた企業評価分析 : 倒産企業の実証分析
- SLP・NL合同セッション「ここまでできるぞ音声/言語処理技術」 : 言語編
- SLP・NL合同セッション「ここまでできるぞ音声/言語処理技術」 : 言語編 : 1 言語処理技術の現状
- 時系列情報を利用した複合語キーワードの抽出(抽出,コーパス)
- 用例ベース翻訳のための対訳文の句アライメント
- 用例ベース翻訳のためのパラレルコーパスからの対訳対発見
- 用例ベース翻訳のためのパラレルコーパスからの対訳対発見
- 編集にあたって(ここまできた自然言語処理-例文の収集とその利用-)
- Web文書に対する言語処理の問題点と言語処理を援助するタグセットについて
- Web文書に対する言語処理の問題点と言語処理を援助するタグセットについて
- 複数の筆者の表記の違いを利用した同義表現抽出(語彙的知識獲得)