英単語の短縮表現による英文章圧縮
スポンサーリンク
概要
- 論文の詳細を見る
英語を計算機で処理するとき,よく使われる内部コードとしてASCIIとEBCDICがある.いずれにも,1バイトを占有する.文献によれば英単語の平均の長さが4.5であるから,一つの単語が平均4.5バイトを占有するということを意味する.漢字の場合,日本のJIS漢字コードや中国のGB(国家標準)コードなどがある.いずれも1漢字が2バイトを占有する.漢字自身の特徴から,記憶容量を削減できるといわれている.例えば"The institute of electronics, Information and communication engineers"はASCIIコードで68バイトを占有する.これを漢字で表した場合は"電子情報通信学会"となり,16バイトを占有する.本稿では英語に限定して,漢字コードの考え方を英語に応用し,英語単語の短縮表現,またそれによる英文関係の文章を圧縮する方法について報告する.
- 1995-03-27
著者
関連論文
- 心像意味論に基づく色彩概念学習システムの試作
- 英単語の短縮表現による英文章圧縮
- 自然言語医療情報システムの改良について
- 市販電子化辞書からの自然言語の意味抽出
- 概念検索機能を備えた自然言語医療情報システムについて
- 概念検索機能を備えた自然言語医療情報システムの試作
- 日本語連接名詞における省略語の復元処理について
- VRMLを利用したネットワーク管理システムの試作
- 心像意味論に基づく日本語連接名詞の構文および意味分析
- 意味解析過程分析システムとその試行例
- 1P1-G07 音声とボタンを組み合わせた命令言語によるヒューマノイドの遠隔操作(コミュニケーション・ロボット)
- 1P1-G06 マルチモーダル命令言語RUNAによる小型ヒューマノイドの操作(コミュニケーション・ロボット)