新聞記事情報に与えるカナ表記キーワードの語長分布
スポンサーリンク
概要
- 論文の詳細を見る
キーワードを用いて,新聞記事のスクラップーファイルを管理しているが,7年余りの間にキーワード(カナ表記)の数は約5,560となった。 このキーワードを対象に,語義のカテゴリ分野別に語長の分布を求め,分布パターン,語の構成,カテゴリ分野の性格,平均語長および最大語長などの関係を考察した。全分野を総合して云えることは,(1)固有名詞のキーワードをも含めて,平均語長は8.4字であり,より近代的な分野ほど(2)平均語長は大きくなり,かつ(3)語長分布のバターンは単純でなくなる。(4)最大語長は37字列のものであるが,99.9%の語は30字列以内の語長であり,99%の語が20字列以内の語長に収まる。キーワードは新聞記事からの採集であるという制限がありながらも,カテゴリ分野別に分析してあるので,一般に工学・技術・産業・経済・社会などに関するシステム設計,データバンク設計に役立つ。
- 1977-11-01