分かち書き方式仮名漢字変換のためのバックトラックを必要としない文法解析
スポンサーリンク
概要
- 論文の詳細を見る
日本語文書処理システムの研究の一環として, 仮名漢字変換方式の日本語エディタを試作したので, これを文法情報の取扱いを中心にして報告する. この仮名漢字変換の入力文は文節分かち書きを原則とするが, 分かち書きを柔軟にするために, 拡張した文節を導入してある. 同音異義語の選択は, 文法規則との整合性と単語の頻度情報に基づいて決めている. 従来の文法解析は, 各単語の接続条件を1対ずつ対比し, 複数の接続可能性に対してはバックトラックなどの複雑な木探索を必要とするものが多いが, 本システムでは仮名漢字変換は付属語連鎖の語構成を必ずしも問題にしないという特徴を積極的に利用して, 接続ベクトル法と呼ぶバックトラックを必要としない簡潔で効率的な分析法を実現した. また, 従来の文法解析は, 自立語候補を引き当てるたびに, それに続く付属語連鎖を分析して候補の妥当性を検定するものが多いが, 接続ベクトル法では, 従来複雑であるとされていた文節終端からの分析も効率よく処理できるようになり, 1回の付属語連鎖の分析で自立語候補の条件がすべて求まるので, その後の自立語候補の接続検定が効率的になるだけでなく, 辞書にない片仮名表記語の推定や, 未登録語の品詞・活用の推定も容易になっている. なお, 漢字を含む拡張付属語は, 構成ベクトルと呼ぶビット列の導入による2段階形態素解析で扱っている.
- 一般社団法人情報処理学会の論文
- 1983-07-15
著者
関連論文
- 「WCC98に参加して/IFIP TC : この1年」
- 会議レポート : SAINT-2001
- 音声認識とシミュレーション
- Hidden Markov Modelに基づいた音声認識 (<小特集>音声情報処理の最近の動向)
- マルコフモデルによる音声認識 (音声処理特集) -- (音声認識)
- ちょっといい話
- 連続単語認識における単語間調音結合補正法
- 分かち書き方式仮名漢字変換のためのバックトラックを必要としない文法解析
- 「ことだま」文書処理システムの文節わかち書き仮名漢字変換
- IBM社内の組織横断的なテクニカルコミュニティー--IBMアカデミーとTEC-J