自然言語解析のためのMSLRパーザ・ツールキット
スポンサーリンク
概要
- 論文の詳細を見る
本論文では,我々が現在公開している自然言語解析用ツール「MSLR パーザ・ツールキット」の特徴と機能について述べる.MSLR パーザは,一般化LR 法の解析アルゴリズムを拡張し,日本語などの分かち書きされていない文の形態素解析と構文解析を同時に行うツールである.MSLR パーザを用いて解析を行う際には,まずLR 表作成器を用いて,文法と接続表からLR 表を作成する.このとき,LR 表作成器は,接続表に記述された品詞間の接続制約を組み込んだLR 表を生成する.このため,接続制約に違反する解析結果を受理しないLR 表が作られるだけでなく,LR 表の大きさを大幅に縮小することができる.次に,MSLR パーザは,作成されたLR 表と辞書を用いて辞書引きによる単語分割と構文解析を同時に行い,その結果として構文木を出力する.さらに,MSLR パーザは,文中の括弧の組によって係り受けに関する部分的な制約が与えられた文を入力とし,その制約を満たす構文木のみを出力する機能を持つ.また,文脈依存性を若干反映した言語モデルのひとつである確率一般化LR モデル(PGLR モデル) を学習し,個々の構文木に対してPGLR モデルに基づく生成確率を計算し,解析結果の優先順位付けを行う機能も持つ. : In this paper, we describe a tool kit for natural language analysis, the MSLR parser tool kit. The ‘MSLR parser’ is based on the generalized LR parsing algorithm, and integrates morphological and syntactic analysis of unsegmented sentences. The ‘LR table generator’ constructs an LR table from a context free grammar and a connection matrix describing adjacency constraints between part-of-speech pairs. By incorporating connection matrix-based constraints into the LR table, it is possible to both reject any locally implausible parsing results, and reduce the size of the LR table. Then, using the generated LR table and a lexicon, the MSLR parser outputs parse trees based on morphological and syntactic analysis of input sentences. In addition to this, the MSLR parser accepts sentence inputs including partial syntactic constraints denoted by pairs of brackets, and suppresses the generation of any parse trees not satisfying those constraints. Furthermore, it can be trained according to the probabilistic generalized LR (PGLR) model, which is a mildly context sensitive language model. It can also rank parse trees in order of the overall probability returned by the trained PGLR model.
- 言語処理学会の論文
- 2000-11-10
著者
-
田中 穂積
北陸先端科学技術大学院大学情報科学研究科
-
橋本 泰一
東京工業大学統合研究院
-
白井 清昭
北陸先端科学技術大学院大学情報科学研究科
-
植木 正裕
国立国語研究所
-
白井 清昭
東京工学大学大学院情報理工学研究科計算工学専攻
-
橋本 泰一
東京工学大学大学院情報理工学研究科計算工学専攻
-
徳永 健伸
東京工学大学大学院情報理工学研究科計算工学専攻
-
田中 穂積
東京工学大学大学院情報理工学研究科計算工学専攻
-
白井 清昭
北陸先端科学技術大学院大学
関連論文
- 社会課題とその解決に結びつく科学技術に関する有用知識の抽出
- 社会課題発見のための文書クラスタリングとクラスタ評価指標(情報分析・要約(テーマセッション1))
- 音声言語関連大型プロジェクトの現状と将来
- パネル討論 : 音声言語関連大型プロジェクトの現状と将来
- 編集にあたって(音声情報処理技術の最先端)
- 品詞間接続制約のLR構文解析表への組み込みの局所性の解消
- 論文と特許を対象にした技術動向分析 第7回,第8回NTCIRワークショップ 特許マイニングタスク
- TREC-7参加報告
- 拡張固有表現タグ付きコーパスの構築(マイニング・知識獲得・固有表現)
- 岩波国語辞典を利用した語義タグ付きテキストデータベースの作成
- 特許情報処理を指向したテストコレクションの構築 : 情報検索と自然言語処理の融合を目指して(NTCIR特別セッション)
- 特許情報処理を指向したテストコレクションの構築 : 情報検索と自然言語処理の融合を目指して(NTCIR特別セッション)
- 代表性のあるコーパスを利用した日本語意味解析(日本語コーパス)
- 「人工知能学事典」編集四方山話
- WWWページからの手順に関する箇条書きの抽出
- 手順の説明を含む箇条書きを抽出するための手がかり分析
- 自然言語を理解するアニメーテッドエージェントのための3次元仮想空間における位置の表現と処理
- E-014 新聞記事からの社会課題に対する技術的対策情報の抽出(自然言語・音声・音楽,一般論文)
- GLRをベースにした自然言語処理用MSLRパーザの改良(評価表現・構文解析)
- 関係データベースを用いた構文木付きコーパス検索手法
- ロボットにおける言語理解(ロボットにおける音響技術)
- ロボットにおける言語理解
- テキスト構文構造類似度を用いた類似文検索手法(セッション3: メタデータとオントロジ応用)
- テキスト構文構造類似度を用いた類似文検索手法(セッション3: メタデータとオントロジ応用)
- 音声対話理解技術とソフトウェアロボットの行動
- 大規模日本語文法の開発
- 言語理解と行動制御 : 音声認識・言語理解・コンピュータグラフィクス技術の統合(特別セッション「言語理解と行動」(1))
- 言語理解と行動制御 : 音声認識・言語理解・コンピュータグラフィクス技術の統合(特別セッション : 言語理解と行動(1))
- 日英言語横断情報検索のための翻訳知識の獲得
- インタラクティブな学習によるロボットの行動命令に含まれる不明確性の解消 (テーマ:一般)
- ロボットとの会話 : 人工知能からのアプローチ(知能ロボットの技術 : 人工知能からのアプローチ(後編))
- 単語の共起情報を利用した文法主導の係り受け解析(基盤・要素技術)(セマンティックウェブと自然言語処理その他一般)
- 音声対話システムにおける日本語自己修復の処理
- 国語辞典とシソーラスの統合
- 音声対話用構文解析器の頑健性の評価
- 事例に基づく演奏表情の生成
- 事例に基づく演奏表情の生成に関する研究
- システム主導型コーパス作成インターフェースとその評価(抽出,コーパス)
- 決定リストにおける規則の適用順序に関する考察
- 自然言語解析のためのMSLRパーザ・ツールキット
- 2000-NL-138-12 統計的手法に基づく形容詞または形容動詞の修飾先の決定
- NLC2000-21 統計的手法に基づく形容詞または形容動詞の修飾先の決定
- 構造付きコーパスからの統語的知識の自動獲得とその精密化
- 言語理解・意味理解の先駆者田中穂積先生の想い出(14)
- 呼応する名詞の包含関係に着目した助数詞オントロジーの自動構築と評価(語彙・知識獲得)
- E-009 名詞と助数詞の呼応関係に基づく助数詞オントロジーの自動構築(E分野:自然言語・音声・音楽)
- 「言語理解-SHRDLUの先にあるもの-」へのコメントと回答
- 大きなコーパスを共有しよう(ここまできた自然言語処理-例文の収集とその利用-)
- 決定リストを用いた語義曖昧性解消
- 専門用語抽出における助詞情報の利用に関する一考察(情報抽出・ラベル付与)
- 初期質問文から蓄積された質問応答への効果的マッチング法
- 単純質問文から蓄積された質問応答文へのナビゲーション
- キーワード抽出の整数計画問題としての定式化(機械学習・応用)
- 社会課題発見のための文書クラスタリングとクラスタ評価指標(情報分析・要約(テーマセッション1))
- 文書クラスタリングによるトピック抽出および課題発見
- 文書からの組織名抽出における辞書利用(情報抽出・ラベル付与)
- 2E07 大規模テキストマイニングによる医療分野の社会課題・技術トレンド抽出(メトリクス,一般講演,第22回年次学術大会)
- 共起語に基づいた階層型文書クラスタリング手法(セッション1:テキストマイニング)
- 共起語に基づいた階層型文書クラスタリング手法(セッション1:テキストマイニング)
- 音声対話システムにおける不適格性の処理
- 音声言語関連大型プロジェクトの現状と将来
- 表層的・構造的対訳対検索の長所と短所
- アニメーション生成のための料理動作辞書の構築(特別セッション「言語理解と行動」(2))
- アニメーション生成のための料理動作辞書の構築(特別セッション : 言語理解と行動(2))
- 自然言語によるアニメーションコントロールシステム : 傀儡
- 大規模日本語文法の開発 : 事例研究
- 大規模日本語文法の開発 : 事例研究
- 会長就任挨拶
- プランニングの知識を用いた照応・省略解決
- コンピュータが拓く新しい言語世界 (特集 ことばのコンピュートピア--人間との対話を目ざして)
- 漢字インデックスを利用したパラフレーズの抽出
- LR表を利用した構造的確率言語モデル - 自然発話コーパスによる評価 -
- 自然言語を理解するソフトウェアロボット:傀儡次世代インタラクションのための情報技術
- 日本語文生成における照応表現の選択
- 寄稿 電子協・機械翻訳・自然言語処理 (特集「電子協活動の思い出と今後への期待」)
- 言語理解とロボットの行動制御 : 音声認識から音声理解へ
- 言語理解とロボットの行動制御 : 音声認識から音声理解へ
- 言語理解とロボットの行動制御 : 音声認識から音声理解へ
- 対話型質問応答システムにおける問い返し文生成に関する基礎研究(文生成)
- 研究者の流動性と研究者の養成 (特集 我が国の研究者養成の展望)
- 決定木に基づく対話行為のタグ付け支援(合同セッション「対話」)
- 決定木に基づく対話行為のタグ付け支援(合同セッション「対話」)
- 辞書定義文を用いた低頻度語のための語義曖昧性解消モデルの学習(多義性解消)
- 辞書定義文を用いた低頻度語のための語義曖昧性解消モデルの学習(多義性解消)(言語理解とコミュニケーション)
- 辞書定義文を用いた低頻度語のための語義曖昧性解消モデルの学習
- SENSEVAL-2 日本語辞書タスク
- SENSEVAL-2日本語タスク
- 加藤先生のエッセイに対する私的雑感 (インタラクティブ・エッセイ)
- 対訳例検索における速度と効率の平衡性
- 日本語における動詞交替の種類と頻度の予備調査
- パラメータによる日本語連体修飾構造の解析
- 構造つきコーパスの共有化に関する一考察
- PGLR法を用いた構文木付きコーパスの自動構築
- 統計的構文解析における構文的統計情報と語彙的統計情報の統合について
- The Exploration and Analysis of Using Multiple Thesaurus Types for Query Expansion In Information Retrieval
- 音声認識を目指した確率GLR法を用いた言語モデルの構築 (音声言語情報処理)
- 言語理解 : SHRDLUの先にあるもの
- 言語理解とソフトウェアロボットの行動制御
- 言語理解とロボットの行動制御
- 右再帰規則の適用回数の制限 : LR表への組み込み