階層構造におけるカテゴリの統合と類似文書抽出への適用(学生セッション I)
スポンサーリンク
概要
- 論文の詳細を見る
本稿では,日英のカテゴリ階層構造に注目し,カテゴリ同士の類似性を推定し,カテゴリを統合する手法を提案する.本手法では一方の階層構造に分類されている文書を,他方の階層構造に分類することにより,異なる階層間におけるカテゴリ同士の類似性を推定する.文書を分類するための手法として機械学習SVMsを用いた.また,類似性を求めるために,X^2statisticsを用いた.さらに,得られたカテゴリの組に対しアプリオリアルゴリズムを用いることで,類似したカテゴリ集合を抽出した.統合したカテゴリの有効性を検証するため,類似文書の抽出を行った結果,適合率は0.328であり階層構造を利用しない手法(0.088)と比較して精度の向上がみられた.
- 2007-05-24
著者
関連論文
- 単語の類似尺度に基づくシソーラス辞書への用例付与(学生セッション II)
- WordNetの同義語クラスとその上位関係を利用した文書の自動分類
- Web上から取得した共起頻度と音象徴によるオノマトペの自動分類(自然言語処理)
- マルチモーダルユーザインターフェースを備えた高次コミュニケーション空間の構築に関する研究開発通信放送機構委託研究(1997-2001)
- 単語の類似尺度に基づくシソーラス辞書への用例付与(学生セッション II)
- コーパスに基づく動詞の多義解消
- コーパスに基づく動詞の多義解消
- 超高速ATM LANの構築法と次世代ユーザーインタフェースに関する研究
- 階層構造におけるカテゴリの統合と類似文書抽出への適用(学生セッション I)
- 階層構造におけるカテゴリの統合と類似文書抽出への適用(学生セッション I)
- マルチラベルの分野名タグに対する事例間類似度に基づいた誤り修正(自然言語処理)
- 分野の階層構造を利用したコーパスの誤り修正と文書分類への適用(自然言語処理)
- TD-2-1 知的情報検索のための大規模言語データの利用(TD-2. WEB知的処理の基礎)
- 話題の推移に基づく続報記事の自動抽出(自然言語)
- 語義の曖昧性解消のための最適な属性選択
- 語義の曖昧性解消のための最適な属性選択
- 語の重み付け学習を用いた文書の自動分類
- 類推に基づく語の重み付け学習を用いた動詞の多義解消
- 音声とポインティングジェスチャを利用した指示物同定
- 文脈依存の度合を考慮した重要パラグラフの抽出
- ニュース文の話題セグメンテーション
- 3語の同時出現頻度を利用した前置詞句の係り先の曖昧性解消
- 辞書の語義文を用いた文書の自動分類
- ニュース文を対象とした話題の認識
- 日本語の述部階層構造に基づく形態論的な文法規則の記述法
- ニュース文を対象とした話題毎のセグメンテーション
- 3語の同時出現頻度を利用した前置詞句の係り先の曖昧性解消
- 係り受けの強度に基づく依存文法 : 制限依存文法
- 局所化した単一化文法とその表現
- 制限依存文法とその表現
- 少数の正例とラベルなし事例による文書の自動分類(自然言語処理)
- Web掲示板における皮肉の分類および自動検出