類似度の高いサブクラスタに基づく名詞クラスタリング(「ユニバーサルコミュニケーションを実現するための言語処理技術」シンポジウム)
スポンサーリンク
概要
- 論文の詳細を見る
PantelらがCBCという類似度の高いサブクラスタをあらかじめ作成しておく事でサブクラスタに基づいた揺れの少ない統合と語義を考慮した再統合を行うクラスタリング手法を提案したが,本研究ではCBCを基に係り受けパターンを利用した名詞クラスタリングを行い同義語・類義語クラスタの獲得を目指す.本論文ではCBCの既存の式ではなく確率分布を用いた類似度計算式(Jensen-Shannon)の使用,並びにサブクラスタ候補を決定する新しいスコアリング方法を用いた日本語の名詞クラスタリング手法を提案する.毎日新聞94年度1年分を用いてCBCに用いられる類似度計算式とJensen-Shannonの比較を行いJensen-Shannonの有効性を示し,さらにスコアリング式をいくつかのパターンで提案・比較を行い適切にサブクラスタ候補を決定するスコアリング方法を求める.
- 2009-01-19
著者
関連論文
- 類似度の高いサブクラスタに基づく名詞クラスタリング(「ユニバーサルコミュニケーションを実現するための言語処理技術」シンポジウム)
- 動詞項構造シソーラスに基づく動詞語義ならびに意味役割付与データの構築
- 語彙概念構造を利用した複合名詞内の係り関係の解析(システムLSIの設計技術と設計自動化)
- 文法的制約を用いた複合語解析モデルの作成
- 含意関係計算のための事態オントロジーの開発に向けて(言語理解とオントロジーシンポジウム)
- 語彙概念構造に基づく日本語動詞の統語・意味特性の記述 (まえがき)
- 分類の根拠を明示した動詞語彙概念構造辞書の構築(辞書と辞典)
- SRLを利用した規則ベースの感染症用語抽出
- 類似した動作や状況を検索するための意味役割及び動詞語義付与システムの構築(第1回集合知シンポジウム〜言語処理が紡ぎ出す未来〜)
- グラフに基づくクラスタリングによる動詞類義語の獲得(自然言語の論理と感情)
- グラフに基づくクラスタリングによる動詞類義語の獲得(自然言語の論理と感情)
- 生物学文献からの専門用語抽出における機械学習モデルの検討
- 生物学文献からの専門用語抽出における機械学習モデルの検討
- メタファ分析に基づく置換可能な動詞カテゴリの作成(述語/動詞の言い換えとクラスタリング・分析)
- 多義性を考慮した同時共起クラスタリングによる動詞の類語抽出(「ユニバーサルコミュニケーションを実現するための言語処理技術」シンポジウム)
- 名詞の概念体系を利用した規則に基づく意味役割付与モデルの構築(語彙意味論・知識表現)
- 名詞の概念体系を利用した規則に基づく意味役割付与モデルの構築(語彙意味論・知識表現)
- 語彙の制約を考慮した複合語解析モデルの構築
- 語彙の制約を考慮した複合語解析モデルの構築
- 言語情報処理における辞書と語彙概念構造 (まえがき)
- 候補の接続関係を考慮した複合語用語抽出
- 形態素出現パタンに基づく文書集合類似性評価(スパム検出・類似性評価)
- 動詞の語義と意味役割を付与したタグ付コーパスの作成
- 用語クラスタリングに基づく部分研究領域推定と用語分類(語彙・意味)
- 用語クラスタリングに基づく部分研究領域推定と用語分類(語彙・意味)
- 日本語複合語用語の入れ子関係に基づく階層的体系化
- 日本語複合語用語の入れ子関係に基づく階層的体系化(語彙1)
- 日本語専門分野テキストコーパスからの複合語用語の抽出(抽出)
- 文法パターンに基づく用語抽出モデルの構築(言語理解とコミュニケーション一般)
- 語彙概念構造を利用した助詞「に」に関する複合名詞の分析
- 語彙概念構造を利用した助詞「に」に関する複合名詞の分析
- 専門分野における複合名詞解析のための名詞文法属性の分類について
- 複合名詞に着目したWeb検索結果のクラスタリング(文書分類・評判分析)
- 複合名詞に着目したWeb検索結果のクラスタリング(文書分類・評判分析)
- 少数正解事例に基づく動詞語義及び名詞意味役割付与システム(辞書ベース,自然言語処理)
- サ変名詞を含む複合名詞の語義解析システム及び名詞辞書の構築(辞書ベース,自然言語処理)
- 網羅的な検出を重視した異形パターンに基づく日本語慣用句同定システム(辞書ベース,自然言語処理)
- 少数正解事例に基づく動詞語義及び名詞意味役割付与システム(辞書ベース,自然言語処理)
- サ変名詞を含む複合名詞の語義解析システム及び名詞辞書の構築(辞書ベース,自然言語処理)
- 網羅的な検出を重視した異形パターンに基づく日本語慣用句同定システム(辞書ベース,自然言語処理)
- 動詞とその結果状態を関係付ける結果状態辞書の構築(辞書ベース,自然言語処理)
- 統計的学習モデルとルールベースモデルに基づく用語抽出システムの比較(基礎技術,自然言語処理)
- 統計的学習モデルとルールベースモデルに基づく用語抽出システムの比較(基礎技術,自然言語処理)
- 動詞とその結果状態を関係付ける結果状態辞書の構築(辞書ベース,自然言語処理)
- 述語の分析に基づく文書解析の考察
- グラフ構造に基づく同時クラスタリングを利用した動詞の属性クラスの抽出(述語/動詞の言い換えとクラスタリング・分析)
- 日本語用語抽出と風力発電分野における日仏用語抽出の考察(基礎技術,第4回集合知シンポジウム)