漢字コードのメタコード化の方法
スポンサーリンク
概要
- 論文の詳細を見る
情報交換用に設定された漢字コードはJISXO2O8、JIS術0212、G823I2(中国)、KSC560l(韓国)、米国におけるUNIX、ユニコード(Unicode)がある。また、国際標準化磯櫛(ISO)においても各国の漢字コードを統合した世界共通の漢字コード(DISlO646)の作成を進めている。JISXO208は、1978年に制定され、1983年に第一回の改訂がおこなわれた。新版は、旧版との間に互換性を崩す間題があった。原因は、JISXO2O8における各水準への正字と異体字の配当規則が常用漢字、人名地名漢字の字体改訂に対し水醜聞で文字の入れ替えを避けられないものにした。そのほか、JISXO2O8には、多国言語の混在処理、漢字の属性憎細(画数・部・読み)の規定、字体の整理とコード配当の方法など改善すべき点が多い。また、JISX02O8とISO案にも(1)コード間への追加磯能とコードの拡張法の欠如(2)旧規格で作成したデータとの互換性の維持(3)各種の国家規格とISO規格の調整方法の確立(4)古典文献を含む学術情報ヘの適用力の問題がある。本報告は、現行の漢字コードを包含し、文字パターン・コード・漢字の属性情報を規定できる4バイトコードの提案をおこ通う。4バイトコードを作成するための条件および使用目的は、次の5項目である。(1)JIS噺0201に従う2バイトコードを包含すること。(2)コード間に追加磯能があり、文字の追加によっても基本配列を維持できること。(3)市販の漢和辞書をコードブックに使用するため検字番号の内部コード化と漢字の属性情報の規定、文字、コードの管理手段を確立できること。(4)ローカルネットワークおよび異賎甑間共有データベース用メタコードに使用できること。(5)長期のデータ保存用コードに使用できること。
- 一般社団法人情報処理学会の論文
- 1993-03-01