高速追加処理を可能とする転置ファイル構成法
スポンサーリンク
概要
- 論文の詳細を見る
九州大学大型計算機センターでは,筆者らが設計・開発した情報検索システムAIR[1]を用いて,INSPECなどの文献検索サービスを行っている.AIRは検索速度や更新処理速度,ディスク使用効率のすべてにおいて,他の同種のシステムより圧倒的にすぐれている.AIRでは,キーワードによる検索のために転置ファイルを用いている.文献検索システムにおける更新処理のほとんどはデータの一括追加によるものであるため,AIRでは,転置ファイルの更新を文献の追加に伴うものに限定し,処理を高速化している.しかし,追加を繰り返すと徐々に処理速度が低下するという問題があり,そのため転置ファイルを定期的に再構成する必要があった.そこで本稿では,キーワード転置ファイルへの追加を高速化し,上の問題を解決する方法について議論する.ここで提案する新しい転置ファイル構成法では,キーワードが生起する文献の間隔が非常に偏った分布をすることを利用した,単純かつ効率的な転置ファイルの圧縮符号[3]を採用し,さらに,キーワードを頻度によって分類し,各類毎に追加によって更新を受ける領域を辞書式順序に配置する.この方法によると,ディスクの使用効率も良く,追加処理を非常に高速に行うことができ,しかも追加を繰り返してもこれらの性能は劣化しない.もちろん,検索も高速に行える.
- 1986-10-01
著者
-
篠原 武
九州大学大型計算機センター
-
松尾 文碩
九州大学 工学部
-
篠原 武
九州大学 大型計算機センター
-
二村 祥一
九州大学 大型計算機センター
-
二村 祥一
大分大学 工学部 知能情報システム工学科
関連論文
- 専門情報処理教育のための新しい計算環境 : 分散形計算環境の構築
- 英文科学技術文における名詞句の構造
- 科学技術用語の英日翻訳規則の抽出
- 英文科学技術文における動詞の統語構造
- 文字列パターン照合アルゴリズム
- SIGHAシステムにおけるパタン・マッチングの機能について
- 文献関連情報をもつ研究室用文献データベースの構築
- 文献関連情報を利用した文献データベースについて
- ディレクトリ階層を利用した分散形ハイパーテキストシステムの設計と実現
- 英文科学技術文献情報に対する不要語除去法による自動索引
- 順位符号に基づく英文二次文献情報のデータ圧縮法
- 推論関係型データベース管理システムにおけるプロダクションシステム構築支援機構の設計
- 高速追加処理を可能とする転置ファイル構成法
- 英文科学技術文献のための否定辞書
- 文献情報検索システムAIR(情報の構造化と意味に関する研究)
- 推論関係型データベース管理システム Adbis
- 準最適テキスト圧縮符号
- 科学技術論文抄録における単語の統計的性質
- 英文テキスト圧縮についての一考究
- 文献情報検索システムAIRの改良について
- 情報検索システムAIRの設計と実現について
- 基礎原子式列書換え系による法的推論
- 英文科学技術文の統語構造