品詞間接続制約のLR構文解析表への組み込みの局所性の解消
スポンサーリンク
概要
- 論文の詳細を見る
LR構文解析表(LR表)を作成する際, CFG規則による制約だけでなく品詞(終端記号)聞の接続制約も問時に組み込むことによって, LR表中の不要な動作(アクション)を削除することができる.それにより,接続制約に違反する解析結果を受理しないLR表を作成できるだけでなく, LR表のサイズを縮小することも可能であり,構文解析の効率の向上が期待できる.これまでにも接続制約の組み込み手法はいくつか提案されているが,従来手法では,注目する動作の前後に実行され得る動作を局所的に考慮するため,削除しきれない動作が存在する.そこで,本論文では新しい組み込み手法を提案する.提案手法では,初期状態から最終状態までの全体の実行すべき動作列(アクションチェイン)を考慮し,接続制約を組み込む.評価実験の結果,従来手法と比較して,不要な動作をさらに約1.2%削減でき,構文解析所要時間は約2.4%短縮できることが分かった.最後に,提案手法の完全性について考察する. : Adjacent symbol connection constraints (ASCCs) are very useful for not only morphological analysis of non-segmenting language such as Japanese language, but also for continuous speech recognition of any language. By incorporating ASCCs into an LR parsing table, it is possible to reduce the size of the table, as well as reject anylocally implausible parsing results. Although several algorithms have been proposed, they cannot remove all of the unnecessary actions because they consider only local context. This paper proposes a new algorithm and show some evaluation results. The proposed algorithm incorporates ASCCs by searching for global action chains from the initial state to the final state. According to the results, th e proposed algorithm can remove about 1.2% more actions than ac onventional algorithm, and the parsing time can be reduced by about 2.4%. Lastly, we show the completeness of our algorithm.
- 2009-07-10
著者
-
田中 穂積
北陸先端科学技術大学院大学情報科学研究科
-
田中 穂積
東京工業大学工学部情報工学科
-
橋本 泰一
東京工業大学統合研究院
-
白井 清昭
北陸先端科学技術大学院大学情報科学研究科
-
橋本 泰一
東京工業大学
-
野呂 智哉
東京工業大学大学院情報理工学研究科
-
白井 清昭
北陸先端科学技術大学院大学
-
野呂 智哉
東京工業大学
関連論文
- 社会課題とその解決に結びつく科学技術に関する有用知識の抽出
- 社会課題発見のための文書クラスタリングとクラスタ評価指標(情報分析・要約(テーマセッション1))
- 音声言語関連大型プロジェクトの現状と将来
- パネル討論 : 音声言語関連大型プロジェクトの現状と将来
- 編集にあたって(音声情報処理技術の最先端)
- 品詞間接続制約のLR構文解析表への組み込みの局所性の解消
- ソフトウェア科学会第3回大会
- 論文と特許を対象にした技術動向分析 第7回,第8回NTCIRワークショップ 特許マイニングタスク
- TREC-7参加報告
- 拡張固有表現タグ付きコーパスの構築(マイニング・知識獲得・固有表現)
- ソフトウェア科学会第5回大会
- 岩波国語辞典を利用した語義タグ付きテキストデータベースの作成
- 特許情報処理を指向したテストコレクションの構築 : 情報検索と自然言語処理の融合を目指して(NTCIR特別セッション)
- 特許情報処理を指向したテストコレクションの構築 : 情報検索と自然言語処理の融合を目指して(NTCIR特別セッション)
- 代表性のあるコーパスを利用した日本語意味解析(日本語コーパス)
- 「人工知能学事典」編集四方山話
- 座談会 「人工知能研究の現状と問題点」
- WWWページからの手順に関する箇条書きの抽出
- 手順の説明を含む箇条書きを抽出するための手がかり分析
- 「論理と自然言語」特集号を編集するにあたって
- 自然言語処理における Prolog (プログラミング言語 Prolog)
- BUPトランスレ-タ--文法規則から構文解析プログラムの自動生成
- 自然言語を理解するアニメーテッドエージェントのための3次元仮想空間における位置の表現と処理
- E-014 新聞記事からの社会課題に対する技術的対策情報の抽出(自然言語・音声・音楽,一般論文)
- 複数の人間と協調する演奏システム
- 複数の人間と協調して演奏するシステム
- GLRをベースにした自然言語処理用MSLRパーザの改良(評価表現・構文解析)
- 関係データベースを用いた構文木付きコーパス検索手法
- ロボットにおける言語理解(ロボットにおける音響技術)
- ロボットにおける言語理解
- テキスト構文構造類似度を用いた類似文検索手法(セッション3: メタデータとオントロジ応用)
- テキスト構文構造類似度を用いた類似文検索手法(セッション3: メタデータとオントロジ応用)
- 音声対話理解技術とソフトウェアロボットの行動
- 大規模日本語文法の開発
- 言語理解と行動制御 : 音声認識・言語理解・コンピュータグラフィクス技術の統合(特別セッション「言語理解と行動」(1))
- 言語理解と行動制御 : 音声認識・言語理解・コンピュータグラフィクス技術の統合(特別セッション : 言語理解と行動(1))
- 日英言語横断情報検索のための翻訳知識の獲得
- インタラクティブな学習によるロボットの行動命令に含まれる不明確性の解消 (テーマ:一般)
- ロボットとの会話 : 人工知能からのアプローチ(知能ロボットの技術 : 人工知能からのアプローチ(後編))
- 単語の共起情報を利用した文法主導の係り受け解析(基盤・要素技術)(セマンティックウェブと自然言語処理その他一般)
- 音声対話システムにおける日本語自己修復の処理
- 国語辞典とシソーラスの統合
- 音声対話用構文解析器の頑健性の評価
- 事例に基づく演奏表情の生成
- 事例に基づく演奏表情の生成に関する研究
- システム主導型コーパス作成インターフェースとその評価(抽出,コーパス)
- 決定リストにおける規則の適用順序に関する考察
- 自然言語解析のためのMSLRパーザ・ツールキット
- 2000-NL-138-12 統計的手法に基づく形容詞または形容動詞の修飾先の決定
- NLC2000-21 統計的手法に基づく形容詞または形容動詞の修飾先の決定
- 構造付きコーパスからの統語的知識の自動獲得とその精密化
- 言語理解・意味理解の先駆者田中穂積先生の想い出(14)
- 呼応する名詞の包含関係に着目した助数詞オントロジーの自動構築と評価(語彙・知識獲得)
- E-009 名詞と助数詞の呼応関係に基づく助数詞オントロジーの自動構築(E分野:自然言語・音声・音楽)
- 「言語理解-SHRDLUの先にあるもの-」へのコメントと回答
- AIマップについて
- 意味処理を導入した機械翻訳について : 融合方式 (機械翻訳)
- 論理型言語Prologとその人工知能への応用 (人工知能とシステム制御特集号)
- 機械翻訳システム開発における諸問題
- 大きなコーパスを共有しよう(ここまできた自然言語処理-例文の収集とその利用-)
- 決定リストを用いた語義曖昧性解消
- 自主性を持つ伴奏システム
- 伴奏者の自主性を考慮した自動伴奏システム : テンポ感と依存度を利用した伴奏制御
- 専門用語抽出における助詞情報の利用に関する一考察(情報抽出・ラベル付与)
- 初期質問文から蓄積された質問応答への効果的マッチング法
- 単純質問文から蓄積された質問応答文へのナビゲーション
- キーワード抽出の整数計画問題としての定式化(機械学習・応用)
- 社会課題発見のための文書クラスタリングとクラスタ評価指標(情報分析・要約(テーマセッション1))
- 文書クラスタリングによるトピック抽出および課題発見
- 文書からの組織名抽出における辞書利用(情報抽出・ラベル付与)
- 2E07 大規模テキストマイニングによる医療分野の社会課題・技術トレンド抽出(メトリクス,一般講演,第22回年次学術大会)
- 共起語に基づいた階層型文書クラスタリング手法(セッション1:テキストマイニング)
- 共起語に基づいた階層型文書クラスタリング手法(セッション1:テキストマイニング)
- 音声対話システムにおける不適格性の処理
- 音声言語関連大型プロジェクトの現状と将来
- 表層的・構造的対訳対検索の長所と短所
- 自然言語によるアニメーションコントロールシステム : 傀儡
- 大規模日本語文法の開発 : 事例研究
- 大規模日本語文法の開発 : 事例研究
- 会長就任挨拶
- プランニングの知識を用いた照応・省略解決
- コンピュータが拓く新しい言語世界 (特集 ことばのコンピュートピア--人間との対話を目ざして)
- 漢字インデックスを利用したパラフレーズの抽出
- LR表を利用した構造的確率言語モデル - 自然発話コーパスによる評価 -
- 自然言語を理解するソフトウェアロボット:傀儡次世代インタラクションのための情報技術
- 日本語文生成における照応表現の選択
- 寄稿 電子協・機械翻訳・自然言語処理 (特集「電子協活動の思い出と今後への期待」)
- 言語理解とロボットの行動制御 : 音声認識から音声理解へ
- 言語理解とロボットの行動制御 : 音声認識から音声理解へ
- 言語理解とロボットの行動制御 : 音声認識から音声理解へ
- 研究者の流動性と研究者の養成 (特集 我が国の研究者養成の展望)
- 対訳例検索における速度と効率の平衡性
- 日本語における動詞交替の種類と頻度の予備調査
- パラメータによる日本語連体修飾構造の解析
- The Exploration and Analysis of Using Multiple Thesaurus Types for Query Expansion In Information Retrieval
- 音声認識を目指した確率GLR法を用いた言語モデルの構築 (音声言語情報処理)
- 言語理解 : SHRDLUの先にあるもの
- 言語理解とソフトウェアロボットの行動制御
- 言語理解とロボットの行動制御
- 右再帰規則の適用回数の制限 : LR表への組み込み