日本古典文学本文データベース再構築における諸問題 : XML化の現状と課題
スポンサーリンク
概要
- 論文の詳細を見る
日本古典文学本文データベースは旧版『日本古典文学大系』(岩波書店1957.5〜1963.4)全100巻、約600作品を収録したフルテキストデータベースである。本データベースは古典文学作品の本格的なデータベースとして、これまで高い評価を得てきた。しかし、基本設計から15年近くを経過し、様々な意味で再構築が要請されてきた。これまでKOKINルールと名付けられた特定マークアップ言語で記述されていたデータを、XMLに変換する作業はその一環である。本発表ではデータベース再構築の現場から、具体的にどのような問題が発生し、どのように対応していったのかを報告したい。
- 一般社団法人情報処理学会の論文
- 2002-07-26