漢字複合語の確率的構造解析
スポンサーリンク
概要
- 論文の詳細を見る
従来の研究から,漢字複合語の自動分割についてはかなりの成果が得られているが,複合語がただ分割されているだけでは,その後の段階で十分な意味処理を行うことは難しいそこで我々は,複合語の構造を決定することが,より高度な意味処理を実現する上で重要であると考え,漢字複合語の確率的構造解析の研究を進めている.本稿では,その手法と実験結果について述べる.我々の手法においては,漢字複合語の構造は,文脈自由文法によってモデル化されるその際,漢字複合語を構成する各漠字短単位語に対して,自然言語文における単語の品詞に対応する概念を定義する必要が生じる.この目的のために,各短単位語の複合語内における共起関係の頻度情報を用いて,それらのクラスタリングを行い,得られたクラスタを品詞に対応する概念として用いた.そして次に,上記の文脈自由文法の暖昧性を除去するために,実際のデータにより確率付けされたその文脈自由文法によって漢字複合語を構造解析して,各複合語に対する最も自然な解析木を得ることを目指した.また,本構造解析手法の一つの応用として,かな漢字変換エラーの自動検出の実験を行ったので,その結果も併せて報告する.
- 一般社団法人情報処理学会の論文
- 1988-11-15
著者
-
藤崎 哲之助
日本アイ・ビー・エム(株)東京サイエンティフィック・センター
-
西野 哲朗
東京電機大学理工学部情報科学科
-
西野 哲朗
東京電気大・理工
-
藤崎 哲之助
日本アイ・ビー・エム(株)東京基礎研究所
関連論文
- データベース照会システム「ヤチマタ」と名詞句データ模型
- 統計的手法による漢字複合語の自動分割
- 日本語文書校正支援システムCRITACのテキスト・コンパイラ
- 構造化文書上における校正・推こう手法の検討
- 根方向型語彙機能文法の正データからの学習(理論計算機科学とその周辺)
- EXACT学習 : 質問からの概念学習 (計算的学習理論とその応用)
- 88-14 有向グラフに対するブラウザ
- 木構造図式の描画問題
- 根方向型語彙機能文法に基づく構文解析プログラムの実現(理論計算機科学とその周辺)
- 境界付きNLCグラフ文法の性質(計算および計算量理論とその周辺)
- 学習における計算論的アプローチ : 機械学習に向けて (計算的学習理論とその応用)
- 語彙機能文法と計算量(アルゴリズムと計算量の理論)
- 弱単項二階論理式の例示および反例からの学習(計算量理論とその周辺)
- tally集合上のp-置換群の代数的構造について(計算アルゴリズムと計算量の基礎理論)
- 漢字複合語の確率的構造解析
- 語い機能文法の生成能力の上界について(計算アルゴリズムと計算量の基礎理論)
- 笠井琢美 著, "計算量の理論", 近代科学社, A5判, 236p., \3,100, 1987
- 日本語によるデータベース照会(日本語情報処理)
- 計算機の日本語理解--デ-タベ-ス照会システム「ヤチマタ」
- JSIAIワークステーション(1) : 設計方針と概要
- 「ことだま」文書処理システムの文節わかち書き仮名漢字変換