DE2000-78 二段階圧縮法を用いた大規模テキストファイルの検索と圧縮
スポンサーリンク
概要
- 論文の詳細を見る
本稿では二段階圧縮法を用いた大規模テキストファイルの検索と圧縮について述べる。通常、テキストはハードディスクなどの二次記憶装置に格納されるため、その容量の節約のため何らかの圧縮が施されていることが多い。それら圧縮テキストへの検索は復号処理を伴うため高速化が困難である。一方、検索の高速化にはあらかじめインデックスなどを用いる方法がある。しかし, インデックスを用いることにより必要な記憶容量が増加する。我々はインデックスを用いてテキストファイルを符号化し、そのファイルを更に他の符号化法で符号化を行うことにより、圧縮率が良く高速な検索か可能となる二段階圧縮法を提案した。本稿ではこの方式が、新聞や雑誌データのような、大規模テキストファイルに対し有効であるか検討し、日本語で書かれた新聞データでの評価を示す。
- 社団法人電子情報通信学会の論文
- 2000-07-21
著者
関連論文
- BoF(Birds of a Feather)セッション特別企画「みんなで語る!DB研究継往開来」(BoFセッション)
- 欧州の情報技術への研究支援と日本の取組み
- 大域ウェブアクセスログを用いた検索語想起支援システムの評価に関する検討(履歴応用,夏のデータベースワークショップDBWS 2006)
- 大域ウェブアクセスログを用いた検索語想起支援システムの評価に関する検討(履歴応用)
- Webアクセスログとその利活用(ソーシャルネットワーク時代のWebインタラクション)
- 材料系研究所におけるリポジトリシステムの実践と将来
- (独)物質・材料研究機構における情報発信(ウェブ情報とデータベースに関して(ポスター講演))
- 多変量解析を用いた感性データベース
- 二段階圧縮法のXMLへの適用
- 高速検索を可能とする日本語テキストの二段階圧縮法
- 多変量解析を用いた感性データベース
- 二段階圧縮法のXMLへの適用
- ファイル検索システムのための二段階圧縮法
- 2000-DBS-122-56 二段階圧縮法を用いた大規模テキストファイルの検索と圧縮
- DE2000-78 二段階圧縮法を用いた大規模テキストファイルの検索と圧縮
- 2P-10 検索効率を考慮したテキストファイル圧縮の検討
- 圧縮ファイルに直接検索を行なう一手法
- ワールド・ワイド・データベースの実験システム
- 不完全情報の広域問合せ
- ワールド・ワイド・データベースの問合せ処理
- ワールド・ワイド・データベースシステムの設計
- 広域検索のための関係代数の拡張
- 広域検索のための関係代数の拡張
- テキストファイルにおける圧縮率と検索効率の向上
- 1Q-7 画像データベースの検索方法についての一考察
- ベクトル量子化における画像信号に一般化調和解析を用いた画像符号化
- AND節点の並列探索を加えたAND/OR木階層的挟み撃ち探索(アルゴリズム)
- 証明数・反証数を閾値とした反復深化法の複数経路同時探索による高速化(数値計算アルゴリズム(2), 「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2005))
- MATLABからC言語への変換における変数の動的解析削減手法(HPC-12 : 最適化と性能評価)(2004年並列/分散/協調処理に関する『青森』サマー・ワークショップ(SWoPP青森2004) : 研究会・連続同時開催)
- 命令キャッシュを考慮したコード生成法による方程式求解の高速化手法(ARC-4 : 実行スケジューリング)(2004年並列/分散/協調処理に関する『青森』サマー・ワークショップ(SWoPP青森2004) : 研究会・連続同時開催)
- AND/OR木におけるAND節点に対する並列探索の評価(CPSY-3 性能評価)(2004年並列/分散/協調処理に関する「青森」サマーワークショップ(SWoPP青森2004))
- 大域ウェブアクセスログを用いた検索語クラスタリング(クラスタリング, 夏のデータベースワークショップ2005)
- 大域ウェブアクセスログを用いたユーザ行動の分析(セッション1A : Webログ)(夏のデータベースワークショップ : DBWS2004)
- ウェブコミュニティを用いたパネルログ解析システムの構築(Web(2))(「夏のデータベースワークショップ(DBWS2003)」一般)
- C-011 命令フェッチコストを考慮したコード生成法による電子回路シミュレーションの高速化(C分野:アーキテクチャ・ハードウェア)
- 仮説概念を用いた広域情報検索
- 証明数・反証数を閾値とした反復深化法の複数経路同時探索による高速化(数値計算アルゴリズム(2), 「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2005))
- 大域ウェブアクセスログを用いた関連語の発見法に関する一考察
- 大域ウェブアクセスログを用いたユーザ行動の分析(Webログ)(夏のデータベースワークショップDBWS2004)
- 大域ウェブアクセスログを用いた検索語クラスタリング(クラスタリング, 夏のデータベースワークショップDBWS2005)
- 大規模アクセスログを用いた検索語想起支援システムの提案とその評価(情報検索・情報解析)
- 大規模アクセスログを用いた検索語想起支援システムの提案とその評価(情報検索・情報解析)
- 格上げ制限2相施錠方式の拡張
- 格上げ制限2相施錠方式の性能評価
- 格上げ制限2相施錠方式の性能評価
- 格上げ制限2相施錠方式の性能について
- 大規模アクセスログを用いた検索支援システムの提案
- ウェブアクセスログ解析による大域的ユーザ行動パターンの抽出(Web上でのユーザモデリング)
- 並行処理制御における2相施錠方式の改良
- 大域ウェブアクセスログを用いた関連語の発見に関する一考察
- ウェブコミュニティを用いた大域ウェブアクセスログ解析法の一提案
- ウェブコミュニティを用いたパネルログ解析システムの構築(セッション10A : Web(2))
- 6J-2 ウェブ空間におけるユーザ行動の理解支援に関する一考察(情報爆発時代における情報検索・推薦技術およびWebコミュニティ分析,一般セッション,「情報爆発」時代に向けた新しいIT基盤技術)
- 4K-7 オブジェクト指向データベースの並行処理制御
- 検索語間の関連を考慮したWbb検索法の提案
- 検索語間の関連を考慮したWeb検索法の提案
- L-019 WebサービスにおけるBtoCのためのレーティングサービスについて(L.インターネット)
- 不完全データベースと広域データベース検索 (メディア統合および環境統合のための高機能データベースシステム、および一般)
- 女性向けフリーマガジンと連動するサイトにおけるユーザの行動分析