話し言葉テキストの性格と電子化テキスト化
スポンサーリンク
概要
- 論文の詳細を見る
現代日本語のフルテキストデータベースを構築し,活用するために心要な見通しを述べる.書き言葉テキストが本文の特定が容易なのに対して,文字化資料は本質的に話し言葉テキストそのものを表しえない.これを「話体テキスト」と呼ぶ.電子化テキスト化に際しては話体テキストの特徴をふまえ,原テキストが生の話し言葉と突合わせが出来る形で作成されること,そうした原テキストを用いてプレーンテキストの形で公の使用に供することが必要である.また,公のコーパスをより良質なものにしていくために,個人がデータベースを構築・活用できる環境の整備が必要である.そのためにMIFESのみを用いた電子化テキスト作成の実際を紹介する.
- 一般社団法人情報処理学会の論文
- 1994-05-27
著者
関連論文
- 日韓中の外言談話にみる発想と表現 : 日本語と日本語教育のための基礎的研究
- 言語生活(1998年・1999年における国語学界の展望)
- 日本語教育と国語教育の接点 : だ・である体の習得について
- 接続詞「しかし」の意味・用法
- 話し言葉テキストの性格と電子化テキスト化
- リソースとしての日本語教育実習