構文森を用いた実コーパスからの大規模な文脈自由文法の高速学習法
スポンサーリンク
概要
- 論文の詳細を見る
The task of inducing grammar structures has received a great deal of attention. The reasons why researchers have studied are different; to use grammar induction as the first stage in building large treebanks or to make up better language models. However, grammar induction has inherent computational complexity. To overcome it, some grammar induction algorithms add new production rules incrementally. They refine the grammar while keeping their computational complexity low. In this paper, we propose a new efficient grammar induction algorithm. Although our algorithm is similar to algorithms which learn a grammar incrementally, our algorithm uses the graphical EM algorithm instead of the Inside-Outside algorithm. We report results of learning experiments in terms of learning speeds. The results show that our algorithm learns a grammar in constant time regardless of the size of the grammar. Since our algorithm decreases syntactic ambiguities in each step, our algorithm reduces required time for learning. This constant-time learning considerably affects learning time for larger grammars. We also reports results of evaluation of criteria to choose nonterminals. Our algorithm refines a grammar based on a nonterminal in each step. Since there can be several criteria to decide which nonterminal is the best, we evaluate them by learning experiments.
- 社団法人 人工知能学会の論文
- 2004-11-01
著者
-
佐藤 泰介
東京工業大学大学院情報理工学研究科計算工学専攻
-
亀谷 由隆
東京工業大学大学院情報理工学研究科
-
栗原 賢一
東京工業大学大学院情報理工学研究科計算工学専攻
-
佐藤 泰介
東京工業大学
-
栗原 賢一
東京工業大学大学院情報理工学研究科
関連論文
- 統計的アブダクション(論理に基づく推論研究の動向)
- BDD上の命題化計算に基づくEMアルゴリズム
- 発見科学の構想と展開(発見科学)
- ベイジアンネットワークと離散構造処理系 (特集 ベイジアンネットワークの最先端)
- 統計的アブダクション
- ベイジアンネットと信念伝播の新潮流(自動推論 : 演繹, 帰納, モデル検査/生成, 仮説推論アブダクション, 論理プログラム, プランニング, 時相論理, etc.)
- ルールの本体での置換と選言標準形への変形による論理プログラムの計算手続き
- 論理式の置換と選言標準形への変形による論理プログラムの計算手続き
- 論理式の置換と選言標準形への変形による論理プログラムの計算手続き (テーマ:「予兆・チャンスの発見とその応用」および一般)
- 論理プログラムの新しい完備化と論理式の置換に基づく計算手続きについて
- 等号公理下での論理式の標準形とその一階言語への応用 (数式処理における理論と応用の研究)
- 論理プログラムの完備化と論理式の展開による証明手続きについて (プログラム変換と記号・数式処理)
- 最小汎化の組合せ探索による帰納推論
- ベイジアンネットワークと離散構造処理系(ベイジアンネットワークの最先端)
- D-12-25 番組視聴型ウェブサーフィンモデルを用いた自動テレビ番組生成(D-12. パターン認識・メディア理解, 情報・システム2)
- 命題論理に基づく確率モデルのための二部決定グラフと順序符号化を用いた効率的なEMアルゴリズム(一般講演(構造学習・ベイジアンネット・確率推論),機械学習とその応用)
- 戦略的英語論文投稿のために(国際会議に通すための英語論文執筆)
- 言語理解・意味理解の先駆者田中穂積先生の想い出(10)
- 習慣的な行動の確率文脈自由文法に基づくベイズ識別(画像認識, コンピュータビジョン)
- PRISM : 確率モデリングのための論理プログラミング処理系(ソフトウェア論文,ソフトウェア論文)
- BDD上の命題化確率計算に基づくEMアルゴリズム (「AIを深化させるための基本問題」および一般)
- 頻出部分木発見手法を用いた遺伝的プログラミングの交通信号制御問題への適用
- グラフィカルモデルにおける論理的アプローチ(ベイジアンネットワークと確率的情報処理の新展開)
- 構文森を用いた実コーパスからの大規模な文脈自由文法の高速学習法
- クラスターBPの実装の改良(ベイジアンネット2 : ポスターセッション)
- 動的計画法に基づく確率文脈自由文法の変分ベイズ法(言い換え,文法)
- 確率文法を用いた茶道のお点前認識
- 確率文法を用いた茶道のお点前認識(顔とジェスチャの認識)
- 確率文法を用いた茶道のお点前認識(顔とジェスチャの認識)
- 構造なしコーパスからの大規模な文脈自由文法の高速学習法
- 「ベイジアンネット」にあたって(ベイジアンネット)
- 遺伝的アルゴリズムを用いたスレッドの協調実験
- ベイジアンネットワーク : 不確定性のモデリング技術
- WFSTに基づく確率文脈自由文法およびその拡張文法の高速EM学習法
- 括弧付けなしの文に対する確率文脈自由文法の効率的訓練法
- 確率文脈自由文法及びその拡張文法の高速EM学習法
- 規則数に比例する学習時間を持つ確率文脈自由文法の学習法 (合同研究会"AIシンポジウム'99"(第10回))
- Tablingによる記号的統計モデルの学習高速化に関する考察
- 記号的統計モデル言語PRISM (&特集>「記号論理とAI」)
- 語順の自由性を考慮した文法のLR表作成アルゴリズムに関する研究
- 記号的統計モデリングの世界を探る(論理と推論技術の展開)
- クラスターBPによるKikuchi近似の計算 (論理と学習)
- 階層隠れマルコフモデルに対する簡単な訓練アルゴリズム
- 学習結果の伝達を伴う強化学習
- 否定情報に関する決定木の拡張
- 遺伝的プログラミングを用いたスレッドの協調実験
- 命題化確率計算に基づくMCMCベイズ推定
- 教師プログラムの学習に関する研究