動詞共起情報を含む名詞辞書の獲得と利用
スポンサーリンク
概要
- 論文の詳細を見る
自然言語処理システムにおいては、そのシステムの採用するアルゴリズムに応じた十分な情報を持つ辞書が必要とされる。本稿では、漸進的自然言語理解システムの名詞辞書に記述される動詞と名詞の共起関係をコーパスから獲得する手法について述べる。コーパスからの知識獲得は用例に基づく手法と規則を用いる手法との融合の一つとして近年、広く研究されているが、本研究の目標は現在開発中の漸進的自然言語理解システムで使用するのに十分な情報を持った辞書の作成であり、汎用の辞書あるいは単語集の作成ではない。さて、英語に関しては、日本語と比べて句の順序が比較的制限されているために、コーパス中の文を簡単に構文解析し、得られたパターンをコーパス全体について数え上げることによって、文法的なあるいは語彙的なパターンを獲得する手法が提案されている。一方、日本語の場合は、連用修飾句の語順は比較的自由であるために、このような手法は精度が低く、意味解析や、長い範囲の制約を用いる構文解析といった高コストの処理が必要とされる。ここで示す手法の特徴は日本語の係り受け関係に関するヒューリスティックスを用いることにより、必要とされる共起情報を低コストで収集できることである。
- 一般社団法人情報処理学会の論文
- 1994-03-07
著者
関連論文
- 格情報を制約条件とした動詞階層化の試み
- 文脈情報変換型機械翻訳システムCONTRAST : 解析・生成・知識表現
- 英語テキスト構造と冠詞現象
- テキストにおける首尾一貫性(coherence)と文脈表現構造
- 機械翻訳システムCONTRASTにおける文脈情報の利用
- 文脈と対象世界モデルを利用した機械翻訳へ向けて (「機械翻訳」)
- 助詞「から」の意味分類と判定法
- 語義の特異性を利用した慣用表現の自動抽出
- コーパスからの付属語的表現の自動抽出
- 疑似Nグラムを用いた助詞的定型表現の自動抽出
- コーパスからの関係表現の自動抽出
- JEIDA機械翻訳システム評価基準(品質評価編) : 英日翻訳の品質評価項目の検討と評価用コーパスの作成
- 機械翻訳システム CONTRAST における概念表現
- Computerized Analysis of Syntactic and Semantic Information in Japanese Newspaper Articles
- 比較構造の概念表現について
- 文脈情報翻駅システムCONTRAST (自然言語理解)
- 未定義語を含む文の多段階構文解析
- Qualitative and Quantitative Characteristics of Japanese Sentences
- 日本語新聞記事解析における構文情報および意味情報の抽出法
- 二次記憶上の大規模語彙を用いる自然言語処理システム
- 文脈処理技術 (計算言語学)
- 動詞共起情報を含む名詞辞書の獲得と利用
- 漸進的自然言語理解と概念階層
- 文脈理解のための拡張シソーラス知識表現法