クライアント・サーバ処理における4バイトコードの利用
スポンサーリンク
概要
- 論文の詳細を見る
現在のコンピュータによる漢字処理は、古典文献や漢籍などの図書情報の処理、特許情報処理、日本語教育と教材開発、外国人のための辞書の作成、情報交換の多国化、電子メールなど利用は多様化している。また、ネットワークの普及は、中国・韓国を含む多国語の表現や文字集合・符号を拡張でき、異なる漢字符号をもつコンピュータ間で共通に使用できる符号の開発が必要になった。一方、情報交換に使用されているJIS X0208やシフトJISには、表外字の符号化の方法や読み・画数・部首の規定がなく、古典文献や漢籍処理への対応、GB 2312、KSC 650lを含む多国語の混在処理の機能も欠けていた。これらの漢字符号は、連続した2バイトコードに文字集合を配当し、符号間への文字挿入機能を欠いたことが、コードブックや漢和辞書による文字管理の方法、文字配列に対するキーの標準化への配慮を失わせた。この機能の欠如は、JIS X0208-l990年版で文字集合を5分割させ、文字の配列順序の統一性を失わせた。JIS X0208やシフトJISは、情報交換用漢字符号の基本である、文字や漢字符号の安定性、文字の追加・挿入後の配列基準の維持に問題があり新しい漢字符号の規定が必要になった。本稿では、漢和辞典の検字番号を94進化16進数変換した構造化4バイトコードがJIS X02O8やシフトJISの問題を解決でき、異なる漢字符号をもつコンピュータ間の情報交換用の共通符号にも応用できることを述べる。
- 一般社団法人情報処理学会の論文
- 1993-09-27