4バイトコード対応文字の部分文字集合に対する利用者規定の方法
スポンサーリンク
概要
- 論文の詳細を見る
これまで、提案した4バイトコードは、約83万の文字を符号化できるが、実用上大きすぎる問題がある。本研究では、最初に、4バイトコードに対応する文字集合から同時に94種の文字集合を再符号化する方法を示す。次に、利用者が文字を抽出する過程で得られる2バイト・4バイトコード間の符号変換表の特性を述べ、この表を文字発生装置と併用させることによってデータ作成環境の保存に使用できることを指摘する。最後に、利用者が規定した文字集合と符号を直接比較する方法をモデルを通して述べた。
- 一般社団法人情報処理学会の論文
- 1995-03-15
著者
関連論文
- インターネットにおける学術漢字の符号化に関する基礎的研究
- 大漢和辞典の検字番号に基づく構造化4バイトコードの提案
- 漢字情報と文例情報を結合した日本語データベースの構築
- 4バイトコード対応文字の部分文字集合に対する利用者規定の方法
- 東アジア漢字圏で使用される漢字符号の統合
- 国立国語研究所における高速漢字プリンタシステムの概要