教師データ間距離学習を利用した新語義用例の検出
スポンサーリンク
概要
- 論文の詳細を見る
本稿では,データの一部にラベルが割り当てられた集合に対して,ラベル情報も考慮した外れ値の検出手法を提案し,用例集合から新語義として使用した用例候補の検出を行う.提案手法の有効性を評価するために,人工的に生成したデータによる外れ値検出を行う実験と Semeval-2010 日本語 WSD タスクのデータによる新語義用例検出を行う実験を行った結果,提案手法は外れ値の検出件数,および,F 値で LOF,One-Class SVM を上回る検出結果となり,密度に基づく新語義検出において,教師データの利用が有効であることが分かった.また,多くの用例について学習後に LOF 値の順位が上がり,距離学習による密度変化が新語義検出に有効であることが分かった.
- 2011-09-09
著者
-
佐々木 稔
茨城大学工学部情報工学科
-
佐々木 稔
現在 茨城大学工学部情報工学科
-
佐々木 稔
現在,茨城大学工学部情報工学科
-
新納 浩幸
現在,茨城大学工学部情報工学科
-
新納 浩幸
現在 茨城大学工学部情報工学科
関連論文
- EMアルゴリズムの最適ループ回数の予測を用いた語義判別規則の教師なし学習(自然言語)
- 潜在的文脈関連度を用いた検索質問拡張
- 機械学習を用いた喉頭摘出者音声を対象とした無声摩擦音の補完(福祉と知能・認知障害/一般)
- 機械学習を用いた喉頭摘出者音声を対象とした無声摩擦音の補完(福祉と知能・認知障害/一般)
- NMFによる重み付きハイパーグラフを用いたアンサンブル文書クラスタリング
- Webサイトの階層的なWebディレクトリへの自動分類手法
- 半教師有りクラスタリングを用いた語義数の推定と語義別用例の収集
- Webサイトの階層的なWebディレクトリへの自動分類手法(QA・Web検索)
- NMFとリンクベースの修正法によるピンポン型文書クラスタリング(一般セッション「分類と抽出」)
- NMFとリンクベースの修正法によるピンポン型文書クラスタリング(一般セッション「分類と抽出」)
- EMアルゴリズムの最適ループ回数の予測を用いた語義判別規則の教師なし学習
- 半教師有りクラスタリングを用いた語義数の推定と語義別用例の収集(語彙2)
- 文書分類を用いたスパムメール判定手法(フィルタリング、文書分類)(テーマ:「Webマイニングによる情報活動と自然言語処理」その他一般)
- 文書分類を用いたスパムメール判定手法(フィルタリング、文書分類)(テーマ:「Webマイニングによる情報活用と自然言語処理」その他一般)
- Webページ内の目的部分の自動抽出(情報抽出・翻訳知識獲得)
- 多項分布と一様分布の混合分布による語義の事前分布の推定(多義性解消)
- 多項分布と一様分布の混合分布による語義の事前分布の推定(多義性解消)(言語理解とコミュニケーション)
- 多項分布と一様分布の混合分布による語義の事前分布の推定
- SVDPACKC とその語義判別問題への利用
- 単語クラスタリングの語義判別問題への応用
- 情報検索手法を利用した語義判別問題の高速解法
- 教師データ間距離学習を利用した新語義用例の検出
- H-005 昼間における空画像からの雲と太陽領域の抽出手法(映像解析・照明,H分野:画像認識・メディア理解)