複合化確率文脈自由文法の提案
スポンサーリンク
概要
- 論文の詳細を見る
自然言語処理において, 文脈自由文法(CFG)ではある文に対して構文解析を行なった場合, 一般に複数の構文木が導出される。そのため解析結果をそのまま意味解析や翻訳等の処理に渡すと処理量が増大する。そこで, 処理の効率化をはかるために, 構文木間に優先順位を設けて後処理に渡す構文木の数を紋ることが考えられ, 例えば, 構文木に生起確率を与える確率文脈自由文法(PCFG)を用いて優先順位をつけることができる。従来のPCFGでは標本列(構文木列)を単一の発生源から収集されたものとしていた。しかし, 実際の言語データが一つの発生源から得られたものか否かわからず, さらに, 自然言語がPCFGで完全に表せるとも限らない。そこで, 実際の言語現象に柔軟に対応できるようにするため, 実際のデータは複数の発生源から収集されるものとして, 複数のPCFGをもつ複合化確率文脈文法(以下, 複合化文法という)を提案する。本研究では, 学習データから得られた複合化文法が, 実際にどのような発生源から得られたかがわからないことを考慮して, 文法数(複合化度)の決定法と適用確率の推定法を提案する。
- 1997-09-24
著者
-
冨浦 洋一
九州大学大学院システム情報科学研究院
-
日高 達
九州大学名誉教授
-
日高 達
九州大学大学院システム情報科学研究院知能システム学部門
-
冨浦 洋一
九州大学
-
横林 由理枝
九州大学大学院システム情報科学研究科
関連論文
- 雑談自由対話を実現するためのWWW上の文書からの妥当な候補文選択手法
- 高速なParzen推定を用いた動的背景モデルによる映像からの物体検出
- 特集「研究開発における情報利用と著作権」にあたって
- シソーラスを用いた派生語の仮名漢字変換の特性(仮名漢字変換・形態素構文解析)
- 日本語作文支援における共起を利用した代替候補提示システム(学習・教育支援のための技術開発)
- 確率的変換に基づくインターネット調査手法の解析(ネットワークコミュニティ,ネットワークを支えるソフトウェア技術論文)
- 語義文からの動詞間の上位-下位関係の抽出
- 語義文における動詞間の上位-下位関係
- 語義文からの動詞の上位-下位関係の抽出
- 語義文における動詞間の上位-下位関係
- 確率文節文法とその応用
- ブラケット文法--句構造言語を特性化する文脈自由文法
- 一括処理法による手書き漢字の認識実験
- 手書き漢字の識別実験
- 語義文の機能表現について
- 国語辞典に基づくシソーラスの構築に関する一考察
- 名詞句「NのN」の解析におけるシソーラス知識の利用
- シソーラスと確率文法による派生語解析
- 用例に基づく派生語の確率的解析
- 用例に基づく派生語の確率的解析
- 仮説検定に基づく英文書の母語話者性の判別
- 仮説検定に基づいた言語識別(機械翻訳・言語識別)
- 統計的アプローチによる英語スラッシュ・リーディング教材の自動生成(自然言語)
- Web文書を言語資源とする情報検索型対話システム
- Web上の語の共起性に基づいたコロケーションの翻訳支援(ネットワークサービス)
- コロケーション翻訳支援システムに対する有用性の調査
- Web文書中の語の共起性を用いたコロケーション翻訳支援システムの実装
- 翻訳文法のための構文解析手法
- 翻訳文法を用いた機械翻訳
- 翻訳文法による機械翻訳とその実装
- 記号列を入出力とするニューラルネットの学習法(知識処理)
- チャンキング過程を考慮したスラッシュ・リーディング用文書の生成
- 編集にあたって(ここまできた自然言語処理-例文の収集とその利用-)
- NS/NNS論文分類モデルに基づく日本人英語科学論文の特徴抽出
- Skew Divergenceに基づく文書の母語話者性の推定
- LF-003 Skew Divergenceに基づく母語話者/非母語話者文書の判別(F. 人工知能)
- 低頻度byte列を活用した言語識別(自然言語)
- 共起データに基づく名詞の多次元空間への配置
- 類語集合対応の推定と英語を介した辞書合成への応用
- 非内容語のN-gramに基づく英語母語話者性の推定(質問応答・文書分類・自動収集)
- 共起データに基づく名詞の多次元空間への配置
- 共起データに基づく名詞のn次元空間への配置
- LE-3 類語集合による英語を介して導出した対訳候補の絞り込み(E. 自然言語・文書)
- 係り受け情報を用いた名詞句「NP_1のNP_2」の意味関係の候補の抽出
- 不完全データに対する判別分析と語の共起性推定への応用
- 不完全データに対する判別分析と語の共起性推定への応用
- 共起制約を組み込んだ確率文法による名詞句の統語的曖昧さの解消
- 意味範疇の散らばりに基づいた名詞の統語範疇の分類
- 係り受け文脈自由文法とその日本語への適用
- 係り受け制約を組み込んだPCFGの評価
- 限定頻度を考慮した確率文脈自由文法
- 係リ受け制約の文脈自由文法への組み込み法
- 係り受け制約を含む文脈自由文法
- 係り受け制約を含む文脈自由文法
- 記号表現ベクトル学習機能を有するニューラルネットの英語前置詞句係り先決定問題における実験的評価
- 要約文の話題の流れの最大化による自動要約
- 汎化用例とシソーラスを用いた派生語の仮名漢字変換の特性
- 話題の流れを保持する自動要約(生成・要約)
- 言語コーパスからの語の共起性の推定(自然言語)
- 言語コーパスからの語の共起性の推定
- 汎化された係り受け文脈自由文法の構文解析法
- スパースな学習データにおける確率係り受け文脈自由文法の確率パラメータの推定法
- 確率文節文法による形態素解析実験について
- 単語の造語モデルを用いた単語の生起確率の推定
- 手書き文字認識におけるベクトルプロセッサの使用について
- 九州大学大学院「ライブラリーサイエンス専攻」の構想と意義
- 位置情報に基づくP2Pネットワークを用いた情報通知プラットフォーム
- Webを源とした質情報付き英語科学論文コーパスの構築法
- 未登録語を含むべた書き日本語文の形態素解析への単語の造語モデルの利用
- 日本語における単語の造語モデルとその評価
- 未登録語の単語らしさの評価論を計算する単語の造語モデル
- ランダムフォレストを用いた英語科学論文の分類と評価
- Prefix-Closed B-tree
- 名詞句「NPのNP」の意味構造
- 最左部分語検索向き辞書データ : Prefix-Closed B-tree
- 統計的手法を用いた名詞句「NPのNP」の意味関係の抽出法
- 名詞句「NPのNP」の意味構造推定のための名詞の統語範疇の獲得
- 博士論文に見る研究テーマの動向(人工知能分野における博士論文)
- 博士論文に見る新しい研究の流れ(人工知能分野における博士論文)
- Web上の大量文書からの語彙知識の獲得(編集委員2007年の抱負)
- LE_004 言語識別技術を応用した英語における母語話者文書・非母語話者文書の判別(E分野:自然言語)
- 語が使われる環境と意味の獲得(ようこそ人工知能の世界へ : 編集委員今年の初夢)
- 語が使われる環境と意味の獲得
- 小特集「言語獲得」にあたって(「言語獲得」)
- 係り受け文脈自由文法の強化法
- スパースな学習データにおけるPCFGの確率パラメタの推定法
- スパースな学習データにおけるPCFGの確率パラメタの推定法
- スパースな学習データにおける確率係り受け文脈自由文法のパラメタ推定法
- k-NN推定法に基づく統語的あいまいさの解消法
- 複合化確率文脈自由文法の提案
- k-NN推定法に基づく統語的曖昧さの解消法
- 常識推論における推論の選択と文脈処理への応用
- 名詞句「NPのNP」の意味構造について
- 日本語単語辞書データ構造Prefix-Closed B-tree : 挿入・削除・編集アルゴリズムとその能率
- 日本語学習者の動詞選択における誤用と正用の関係 : 作文支援のための基礎研究
- 名詞シソーラスを用いた派生語の処理
- PCFGによる派生語処理手法の比較と検討
- 複合名詞の仮名漢字変換のための解析アルゴリズム
- コーパス構築と著作権 : Webを源とした質情報付き英語科学論文コーパス
- 学校英文法の学参例文データベースとその応用:日本人英語科学論文における文法項目の使用傾向