大漢和辞典の検字番号に基づく構造化4バイトコードの提案
スポンサーリンク
概要
- 論文の詳細を見る
JIS X 0208には,符号間への文字の挿入機能の欠如や中国・韓国語への拡張機能の問題がある.本研究では,諸橋轍次編「大漢和辞典」の検字番号に基づく構造化4バイトコードの符号化法と活用法を述べた.最初に,4バイトコードの構造を(1)大漢和辞典の検字番号を16進化94進数変換した整数部3バイトと小数部1バイト符号(2)既存の2バイトコードを統合した符号(3)2の8ビット目が`01'である符号を2個結合した3種にまとめ,これらが画数・読み・部首情報の漢和辞書による基準化,多国語の表現,一字体一符号化を実現できることを示した.次に,符号間への文字の追加機能をつかった一字体一符号化法が,文字集合と漢字符号の固定や文字集合間の互換性を維持した文字集合の分割に利用できることを述べた.最後に,4バイトコードの機能をワークステーション(EWS-4800)とパーソナルコンピュータ(PC-9800)間のデータ伝送を通して検証した.その結果,4バイトコードは,JIS X 0208-1978の見直しで生じたデータ間の互換性を崩す問題を解決でき,異機種間の共通符号にも使用できる見通しをえた.
- 一般社団法人情報処理学会の論文
- 1994-06-15
著者
関連論文
- インターネットにおける学術漢字の符号化に関する基礎的研究
- 大漢和辞典の検字番号に基づく構造化4バイトコードの提案
- 漢字情報と文例情報を結合した日本語データベースの構築
- 4バイトコード対応文字の部分文字集合に対する利用者規定の方法
- 東アジア漢字圏で使用される漢字符号の統合
- 国立国語研究所における高速漢字プリンタシステムの概要