順位符号に基づく英文二次文献情報のデータ圧縮法
スポンサーリンク
概要
- 論文の詳細を見る
本稿では,英文二次文献情報に対する実用的データ圧縮プログラムの実現とその性能について述べる.このプログラムの圧縮技法は,QOCと呼ぶテキスト圧縮符号を核にしたものである.QOCは,基本的には順位符号と呼ぶ単語を圧縮単位とする可変長符号であり,最適符号ではないが最適に近く,また符号器と復号器が高速であるため,きわめて実用性が高い.このデータ圧縮プログラムを1年分のINSPECテープを使って圧縮したところ,圧縮率は分野によって多少異なるが,平均2.20ビット/字〜2.42ビット/字と良好な結果を得た.また,FACOM M-382計算機上での平均符号化時間および復号化時間は,分野によらず,それぞれ3.90マイクロ秒/字,1.09マイクロ秒/字と非常に高速であった.このデータ圧縮プログラムは,九州大学大型計算機センターにおいて会話型,情報検索システムAIRによるINSPECテープの検索サービスに使用されている.
- 1987-03-15
著者
-
松尾 文碩
九州大学大学院システム情報科学研究科
-
二村 祥一
九州大学大型計算機センター
-
二村 祥一
大分大学 工学部 知能情報システム工学科
-
松尾 文碩
九州大学大学院 システム情報科学府 情報理学専攻
関連論文
- 専門情報処理教育のための新しい計算環境 : 分散形計算環境の構築
- WindowsマシンにおけるSeepの実装
- 英文科学技術文における名詞句の構造
- 英文科学技術抄録文における名詞の決定
- 英文科学技術文における被修飾名詞の決定
- 極大共通生垣を用いた情報抽出手法の提案
- 極大共通生垣を用いた情報抽出手法の提案
- 英文科学技術文における単純名詞句決定法の比較
- 英文科学技術文における単純名詞句決定法の比較
- 単語の頻度情報の偏りを用いた文書の自動分類手法の提案
- 科学技術文における共起情報を用いた関連語の抽出
- 2000-CH-46-3 / 2000-MUS-35-3 主旋律の類似性について
- 2000-CH-46-3 / 2000-MUS-35-3 主旋律の類似性について
- 5G-2 音符列比較における類似性指標の評価
- 科学技術用語の英日翻訳規則
- 科学技術用語の英日翻訳規則の抽出
- 英文科学技術文における動詞の意味的分類
- 英文CISGの格構造化手続きの開発
- 英文科学技術文における前置詞を伴う動詞句の決定
- 英文科学技術文における単純名詞句の範囲決定
- 英文CISGの格構造
- 英文科学技術抄録文からのオントロジー自動作成の試み
- 英文科学技術文における動詞の統語構造
- 科学技術用語オントロジーの自動作成
- 文献関連情報をもつ研究室用文献データベースの構築
- 文献関連情報を利用した文献データベースについて
- 英文科学技術文における成句について
- 英文科学技術文における前置詞を伴う動詞の統語構造
- 高能率2次文献情報検索システムの設計
- ディレクトリ階層を利用した分散形ハイパーテキストシステムの設計と実現
- 英文科学技術文献情報に対する不要語除去法による自動索引
- 順位符号に基づく英文二次文献情報のデータ圧縮法
- 推論関係型データベース管理システムにおけるプロダクションシステム構築支援機構の設計
- 高速追加処理を可能とする転置ファイル構成法
- 英文科学技術文献のための否定辞書
- 文献情報検索システムAIR(情報の構造化と意味に関する研究)
- 推論関係型データベース管理システム Adbis
- 準最適テキスト圧縮符号
- 科学技術論文抄録における単語の統計的性質
- 英文テキスト圧縮についての一考究
- 文献情報検索システムAIRの改良について
- 情報検索システムAIRの設計と実現について
- 情報検索システムAIRの実現
- 情報検索システムにおける高頻度キーワードの文書参照ファイルの圧縮について
- 情報検索システムにおける文書参照ファイル
- 英文科学技術文における高頻度名詞の分類について
- 単語の品詞とその被修飾度および前方修飾度との関係について
- 英文科学技術文における前方修飾語の決定について
- 英文科学技術文における基本名詞句の構造
- 2単語科学技術用語の英日翻訳について
- 科学技術用語における2単語句の英日翻訳規則
- 英文科学技術抄録文における高頻度動詞の格フレームに関する調査
- 法律文についての知識表現言語
- EDR概念体系辞書における上位-下位関係の推移的閉包の効率的検索
- EDR電子化辞書の検索システム
- 基礎原子式列書換え系による法的推論
- 英文科学技術文の統語構造