構造つきコーパスの共有化に関する一考察
スポンサーリンク
概要
- 論文の詳細を見る
近年、構文情報つきコーパスが利用可能になり、言語知識や統計情報の獲得に役立っている。しかし、形態素情報つきコーパスに比べて作成が困難なことから、量的には十分とは言えない。また、既存の複数のコーパスの間には、単語境界の認定や品詞体系の粒度などに違いがあることから、獲得した情報を容易には統合できないという問題もある。本論文では、異なる品詞体系でも共有可能な構造情報についての考察を行なう。構造情報を、品詞体系の違いに影響されない品詞体系非依存部分と、品詞体系の違いを吸収するための品詞体系依存部分に分け、品詞体系依存部分の文法のみを入れ換えて形態素・構文解析を行なうことで、コーパスへの形態素情報・構造情報の付与を行なう。
- 一般社団法人情報処理学会の論文
- 1998-11-05
著者
-
田中 穂積
東工大
-
徳永 健伸
東工大
-
白井 清昭
北陸先端科学技術大学院大学情報科学研究科
-
植木 正裕
国立国語研究所
-
白井 清昭
北陸先端科学技術大学院大学
-
植木 正裕
東工大
-
白井 清昭
東工大
関連論文
- 品詞間接続制約のLR構文解析表への組み込みの局所性の解消
- ソフトウェア科学会第3回大会
- TREC-7参加報告
- 日本語情報検索システム評価用テストコレクション BMIR-J2
- ソフトウェア科学会第5回大会
- 岩波国語辞典を利用した語義タグ付きテキストデータベースの作成
- 代表性のあるコーパスを利用した日本語意味解析(日本語コーパス)
- GLRをベースにした自然言語処理用MSLRパーザの改良(評価表現・構文解析)
- 自然言語解析のためのMSLRパーザ・ツールキット
- 2000-NL-138-12 統計的手法に基づく形容詞または形容動詞の修飾先の決定
- NLC2000-21 統計的手法に基づく形容詞または形容動詞の修飾先の決定
- 構造付きコーパスからの統語的知識の自動獲得とその精密化
- 翻訳困難例文の収集と分類
- 言語理解・意味理解の先駆者田中穂積先生の想い出(14)
- 呼応する名詞の包含関係に着目した助数詞オントロジーの自動構築と評価(語彙・知識獲得)
- E-009 名詞と助数詞の呼応関係に基づく助数詞オントロジーの自動構築(E分野:自然言語・音声・音楽)
- 決定リストを用いた語義曖昧性解消
- GLRパーザの効率化に関する研究
- MSLRパーザにおける未定義語処理の一検討
- 翻訳困難例文の機械翻訳と評価
- アニメーション生成のための料理動作辞書の構築(特別セッション「言語理解と行動」(2))
- アニメーション生成のための料理動作辞書の構築(特別セッション : 言語理解と行動(2))
- 自然言語によるアニメーションコントロールシステム : 傀儡
- 大規模日本語文法の開発 : 事例研究
- 大規模日本語文法の開発 : 事例研究
- LR表を利用した構造的確率言語モデル - 自然発話コーパスによる評価 -
- 日本語文生成における照応表現の選択
- 対話型質問応答システムにおける問い返し文生成に関する基礎研究(文生成)
- 決定木に基づく対話行為のタグ付け支援(合同セッション「対話」)
- 決定木に基づく対話行為のタグ付け支援(合同セッション「対話」)
- 辞書定義文を用いた低頻度語のための語義曖昧性解消モデルの学習(多義性解消)
- 辞書定義文を用いた低頻度語のための語義曖昧性解消モデルの学習(多義性解消)(言語理解とコミュニケーション)
- 辞書定義文を用いた低頻度語のための語義曖昧性解消モデルの学習
- SENSEVAL-2 日本語辞書タスク
- SENSEVAL-2日本語タスク
- 加藤先生のエッセイに対する私的雑感 (インタラクティブ・エッセイ)
- 構造つきコーパスの共有化に関する一考察
- PGLR法を用いた構文木付きコーパスの自動構築
- 統計的構文解析における構文的統計情報と語彙的統計情報の統合について
- 統合的確率モデルを用いた日本語文解析
- 括弧付きコーパスからの日本語確率文脈自由文法の自動抽出
- 種々の制約を統合した統計的日本語文解析
- MSLRパーザにおける未定義語処理の一方式
- EDR日本語単語辞書を用いて形態素解析と統語解析を行なうシステム
- 特集号「SemEval-2 日本語タスクを中心とする日本語語義曖昧性解消」
- パラレルコーパスから自動獲得した用例に基づく語義曖昧性解消
- 母語話者の意識化を促す語彙記述 : 「日本語観察館」が目指すもの