SENSEVAL2日本語翻訳タスクに向けて作成した語義判別規則学習システムIbaraki

概要

論文の詳細を見る
SENSEVAL2日本語翻訳タスクに向けて語義判別規則学習システムIbarakiを作成した.当初, タスクの設定からラベルなし訓練データを用いた教師なし学習の手法が有効と判断し, その方向の戦略をたてたが, 実現できなかった.結果的に単純な決定リストによる学習システムで終わってしまった.本報告では, 教師なし学習手法を用いようとしたいきさつ, 及び断念した理由を述べるとともに, 作成したシステムとその評価, 問題点などを述べる.コンテスト後, Ibarakiにラベルなし訓練データを用いた手法も組み入れた.この件についても簡単に簡単に報告する.
社団法人電子情報通信学会の論文
2001-10-10

著者

新納浩幸
茨城大学工学部情報工学科
新納浩幸
茨城大学工学部

関連論文

EMアルゴリズムの最適ループ回数の予測を用いた語義判別規則の教師なし学習(自然言語)
潜在的文脈関連度を用いた検索質問拡張
語義の特異性を利用した慣用表現の自動抽出
片方向の共起性による述語型定型表現の自動抽出
コーパスからの付属語的表現の自動抽出
疑似Nグラムを用いた助詞的定型表現の自動抽出
コーパスからの関係表現の自動抽出
JEIDA機械翻訳システム評価基準(品質評価編) : 英日翻訳の品質評価項目の検討と評価用コーパスの作成
日本語翻訳タスクへの帰納論理プログラミングの適用
NMFによる重み付きハイパーグラフを用いたアンサンブル文書クラスタリング
Webサイトの階層的なWebディレクトリへの自動分類手法
半教師有りクラスタリングを用いた語義数の推定と語義別用例の収集
Webサイトの階層的なWebディレクトリへの自動分類手法(QA・Web検索)
NMFとリンクベースの修正法によるピンポン型文書クラスタリング(一般セッション「分類と抽出」)
NMFとリンクベースの修正法によるピンポン型文書クラスタリング(一般セッション「分類と抽出」)
EMアルゴリズムの最適ループ回数の予測を用いた語義判別規則の教師なし学習
半教師有りクラスタリングを用いた語義数の推定と語義別用例の収集(語彙2)
文書分類を用いたスパムメール判定手法(フィルタリング、文書分類)(テーマ:「Webマイニングによる情報活動と自然言語処理」その他一般)
文書分類を用いたスパムメール判定手法(フィルタリング、文書分類)(テーマ:「Webマイニングによる情報活用と自然言語処理」その他一般)
Webページ内の目的部分の自動抽出(情報抽出・翻訳知識獲得)
多項分布と一様分布の混合分布による語義の事前分布の推定(多義性解消)
多項分布と一様分布の混合分布による語義の事前分布の推定(多義性解消)(言語理解とコミュニケーション)
多項分布と一様分布の混合分布による語義の事前分布の推定
SVDPACKC とその語義判別問題への利用
単語クラスタリングの語義判別問題への応用
情報検索手法を利用した語義判別問題の高速解法
コーパスを利用した分類語彙表の未登録語義の発見
コーパスを利用した分類語彙表の未登録語義の発見
EM アルゴリズムを用いた教師なし学習の日本語翻訳タスクへの適用
SENSEVAL2日本語翻訳タスクに向けて作成した語義判別規則学習システムIbaraki
日本語形態素解析の分類問題への変換とその解法
素性間の共起性を検査するCo-trainingによる語義判別規則の学習
素性間の共起性を検査するCo-trainingによる語義判別規則の学習
決定リストを弱学習器としたアダブーストによる日本語単語分割
日本語単語分割へのタグなしコーパスとタグ付きコーパスの利用
表記情報をデフォルトの証拠として用いた決定リストによる同音異義語の誤り検出
日本語形態素解析のクラス分類問題への変換とその解法
文字列が単語になる確率を用いた未知語抽出
平仮名N-gramによる平仮名列の誤り検出とその修正 (新しいシステムソフトウェア)
複合語からの証拠に重みをつけた決定リストによる同音異義語判別
誤りやすい同音異義語の収集
誤りやすい同音異義語の収集
複合語判定を優先させた決定リストによる同音異義語判定
コーパスとシソーラスを利用した名詞間距離の設定
2連続平仮名文字列を2次情報とした文検索
外れ値検出手法を利用した新語義の検出

SENSEVAL2日本語翻訳タスクに向けて作成した語義判別規則学習システムIbaraki

スポンサーリンク

概要

著者

関連論文

スポンサーリンク