小規模なコーパスを用いた仮名漢字混じり文と仮名文の対応づけ
スポンサーリンク
概要
- 論文の詳細を見る
イースター島には Rongorongo と呼ばれる未解読文字が遺されている.Rongorongo を歌を歌うように読んでいたという記録があるため,Rongorongo の記号列と現地の古い歌が対応するか否かを統語的に調べる研究を行った.しかし,未解読言語が対象であるために正解を設定できず,結果を評価することが難しい.そこで,既知の言語を用いた同様の問題を設定し,手法の評価を行った.本論文では,日本語の仮名漢字混じりの文と,片仮名のみの文を用いて,それらの対応付けを見つけるある手法について報告する.この手法は,文を文字単位に分割する以上の言語に関する知識をできるだけ用いないように留意している.結果として,仮名漢字混じり文とその読みを正しく表している仮名文との対応付けを見つけることができた.また,出現頻度の高い文字の種類が少ない場合に誤判定されることが分かった.
- 2011-01-21
著者
関連論文
- 剰余選択ゲームに基づいたくじ引きシステム
- プログラミング,何をどう教えているか 関数型言語Standard MLのプログラミング教育
- 関数型言語Standard MLのプログラミング教育(プログラミング,何をどう教えているか)
- 小規模なコーパスを用いた仮名漢字混じり文と仮名文の対応づけ
- 小規模なコーパスを用いた仮名漢字混じり文と仮名文の対応づけ
- Rongorongo符号列とイースター島古謡音韻列の対応
- Rongorongo符号列とイースター島古謡音韻列の対応
- Recognizable Expressionと有限木オートマトンの等価性
- 3.国際大学対抗プログラミングコンテスト(未来のコンピュータ好きを育てる)
- Recognizable Expression と有限木オートマトンの等価性
- Recognizable Setの記号列表現