中国語機械翻訳における敏感語概念
スポンサーリンク
概要
- 論文の詳細を見る
機械翻訳を代表とする自然言語処理において, 文の解析を高精度, かつ効率良く行うという観点からすれば, できるだけ複合語単位で処理することが望ましい. 例えば, 中国語"信息高速公路" (ハイウェー) について我々は"信息"と"高速公路"に分割する必要がない. しかし, 中国語の複合語は, 場合によっては分割しなければ正しく解析できないことが多い. 例えば, "他用机器翻〓文章" (彼は機械で文献を翻訳する) 中の"机器翻〓"について, "机器" (機械)と"翻〓" (翻訳+する) に分解する必要がある. このような複合語を本論文では敏感語と呼ぶことにする. 中国語文の処理において, 形態素解析のある候補を用い構文解析や意味解析などを処理する途中で失敗した場合, このような敏感語のみを次の解析候補とすれば, すべての複合語を解析候補とする必要がなくなる. それで, 敏感語という概念を導入することにより, 高効率的な中国語文処理が期待できる. 本論文では, 上述の敏感語についての概念を提案し, さらに87599語の中国語辞書を用い実験と検討を行った結果を報告する.
- 一般社団法人情報処理学会の論文
- 1998-01-19
著者
関連論文
- 統計手法と言語特徴を用いたテキストアライメント
- 自然言語記述からプログラムへの生成を支援するシステムの提案
- 対訳コーパスから細粒度翻訳知識の自動獲得手法
- 関連語を用いた文の分解に基づく中日機械翻訳システム
- 中日機械翻訳における離合詞の処理手法
- 統計手法と言語特徴を用いたテキストアライメント
- TSPO特徴を利用した中日機械翻訳
- 中日言語のTSPO特徴及びCJMTへの応用について
- 統計情報と文章構造特徴に基づく重要文の自動抽出
- 中国語機械翻訳における敏感語概念