文節単位のコスト最小法による日本語形態素解析
スポンサーリンク
概要
- 論文の詳細を見る
形態素解析で一般的に用いられているコスト最小法では、個々の単語に与える単語コストと隣接する単語間に与える連接コストを用いて、総コストの少ない単語列を優先解として出力する(単語単位の手法)。本論文では、文節および隣接する文節間にコストを与える文節単位の方法、すなわち、文節単位のコストを考慮した形態素解析システムについて述べる。文節単位の手法では、構文的な優先規則を表現できる可能性が増加すると考えられる。文節間コストは、文節自身のタイプと係りうる文節のタイプにより分類した文節カテゴリ間に対してコストを与えることとし、文節カテゴリのbigramの統計データを参考にして、手作業で設定した。新聞記事100文に対する実験を行った結果、98.2%の正解率を得ることができた。
- 社団法人電子情報通信学会の論文
- 1998-05-15
著者
-
池田 尚志
岐阜大学工学部
-
池田 尚志
岐阜大学工学研究科
-
池田 尚志
Department Of Electronics And Computer Engineering Gifuuniversity
-
兵藤 安昭
岐阜大学工学部
関連論文
- 携帯情報端末用スケーラブルフォントの試作と評価 (ヒューマンインタフェースとインタラクション)
- E_037 ミャンマー語の形式名詞構造の分析と日本語との対応(E分野:自然言語)
- E-014 日本語-ミャンマー語機械翻訳システムjaw/Myanmarにおける述語部構造の翻訳について(E.自然言語・文書・ゲーム)
- 日本語-手話機械翻訳の試みと手話文字生成編集システムおよび自動点訳編集システムについて(「ユニバーサルコミュニケーションを実現するための言語処理技術」シンポジウム)
- 品詞N-gram統計情報を用いた日本語文書における誤り検出法について
- 日本語-手話機械翻訳システムに向けて : テキストレベルの翻訳系の試作と簡単な例文の翻訳(福祉と知能・認知障害/一般)
- 手話の表記法とテキストレベルの日本語-手話機械翻訳システムの試みについて(聴覚・言語に関する障害及び加齢,聴覚・言語一般)
- K-064 日本語テキストから手話表記テキストへの機械翻訳の試み(K.ヒューマンコミュニケーション&インタラクション)
- E-34 手話における手指動作記述文の言語解析(自然言語処理応用,E.自然言語・文書)
- 手話における手指動作記述文の言語解析