キーワードの累積数量と出現頻度
スポンサーリンク
概要
- 論文の詳細を見る
新聞記事スクラップの管理にキーワード・システムを用いた場合について,キーワード数の累積の経年的膨脹を計算した。また,これに関連してキーワードの記事ファイルにおける出現頻度によってそれを分類し,その各群の大きさも試算した。この論文の背後には,『記事スクラップ・システムが長年にわたって継続的に運用され,充分に大きなキーワード・ファイルが備えられているような状態では,毎日(あるいは毎月)ごとに新たに誕生するキーワードの数は一定数となる。』という考え方がある。求められた,キーワードの累積数量yは,y=b(1+x/a){1-(1+x/a)^<-G>/p}となる。ここにa, b, p, Gはそれぞれシステムに固有の定数であり, xはキーワードの採集が発足してからの月数である。キーワードの記事ファイル中の出現頻度によって分類した群のうち,一度しか出現してないキーワードの群は最も大きく,頻度が大きくなるほど,群の大きさは小さくなる。また,頻度の小さいものの群のキーワードほど,さらに重ねて出現するであろう確率は小さい。この確率を群のActivityと名付けた。このActivityの性格はいろいろのデータバンクによって異なるものとなるかも知れないが,今後の検討問題としたい。
- 1974-08-01