長さ優先置換による文字列圧縮の線形時間アルゴリズム(<特集>文字列アルゴリズム)
スポンサーリンク
概要
- 論文の詳細を見る
文字列の文法に基づく圧縮とは,与えられたテキストを生成する文法を構築することによってデータのサイズを縮小する圧縮法である.この中で長さ優先置換法とは,テキスト中の部分文字列のうち,重複なく複数回現れている最長のものを生成規則として別の一文字に置換していくものである.本論文では,文字列に対する索引構造の一つである接尾辞木に対して極めて技巧的な構造の更新を行うことにより,この長さ優先置換を線形時間で行うアルゴリズムを提案する.
- 社団法人電子情報通信学会の論文
- 2004-01-22
著者
-
篠原 歩
九州大学大学院システム情報科学研究科
-
竹田 正幸
九州大学大学院システム情報科学研究科
-
稲永 俊介
九州大学大学院システム情報科学研究院
-
篠原 歩
東北大学大学院情報科学研究科
-
竹田 正幸
九州大学システム情報科学研究院情報学部門
-
稲永 俊介
ヘルシンキ大学情報科学科
-
船本 崇
九州大学大学院システム情報科学府情報理学専攻
-
竹田 正幸
九州大学大学院システム情報科学府情報学専攻
-
稲永 俊介
九州大学 大学院システム情報科学研究院
-
竹田 正幸
九州大学大学院システム情報科学府
関連論文
- オンラインランク統合問題 (アルゴリズムと計算機科学の数理的基盤とその応用)
- 九州大学における一般情報処理教育支援システムについて
- 無限n-ボナッチ文字列の繰り返し構造について
- 古典和歌からの知識発見 : モビルスーツを着た国文学者(失われゆく情報の復元・保存技術 : 人文科学における情報処理(文献学・データベース共有・史科編纂))
- 質問学習における学習可能性の統一的特徴づけ
- 基本形式体系に対する非終端記号の導入 (コンピュテーション)
- 圧縮文字列における最長共通部分文字列および回文を求める多項式時間アルゴリズム
- 平衡直線的プログラムで圧縮された文字列の非反復性検証アルゴリズム
- 半導体歩留り解析へのデータマイニング適用手法の提案
- 文字列の繰り返し構造の平均解析 (理論計算機科学の深化と応用)
- 連を多く含む文字列発見のための探索的手法 (理論計算機科学の深化と応用)
- WindowsマシンにおけるSeepの実装
- 国文学の研究教育における機械学習応用(機械学習の科学研究への応用)
- 非定常な木情報源に対応する文脈木重みづけ法に関する研究
- 漸増的なパストライ構築に基づく高速・軽量XML文書フィルタリング(夏のデータベースワークショップ2007(データ工学,一般))
- 漸増的なパストライ構築に基づく高速・軽量XML文書フィルタリング(テキスト検索,夏のデータベースワークショップ2007(データ工学,一般))
- 文字列の圧縮とパターンの照合・発見(「自動化:推論,発見,学習,データマイニング」及び一般)
- 接尾辞配列による効率的な文字列上の同値類計算
- 物名十干部試注
- 医薬品の取り違えミスを防止するための薬名類似度の定量的指標の構築
- 浅香山恋部試注
- 浅香山秋冬部試注
- 秋部試注
- 日本産昆虫総目録のデータベース化について
- 間引き:ロボットのスキル発見における評価の削減手法
- 移調を許した圧縮文字列照合アルゴリズム
- 基本形式体系に対する非終端記号の導入
- 和歌データベースからの類似歌の自動抽出
- 九州大学自己点検・評価関連情報システム(セッション2:XML応用システム)
- ストリーム指向のXQuery処理システムについて(セッション4 : XML・構造化文書の蓄積とアクセス)
- ストリーム指向のXQuery処理システムについて(セッション4 : XML・構造化文書の蓄積とアクセス)
- ストリーム指向の XQuery 処理システムについて
- 長さ優先置換による文字列圧縮の線形時間アルゴリズム(文字列アルゴリズム)
- 高速一方向逐字処理技術に基づくXML文書の検索と変換(セッション3:デジタルコンテンツ管理技術)
- D-28 文字列照合技術に基づくXMLデータ処理(XMLデータ処理,D.データベース)
- 圧縮されたテキスト上のパターン照合 : データ圧縮とパターン照合の新展開
- 極大共通生垣を用いた情報抽出手法の提案
- 極大共通生垣を用いた情報抽出手法の提案
- 古典和歌における反復表現の諸相
- 断片パターンマッチングの計算量的困難性と近似アルゴリズムについて
- 古典和歌集からのテキストマイニング
- 英文科学技術文における単純名詞句決定法の比較
- 英文科学技術文における単純名詞句決定法の比較
- TD-1-5 文学作品からのテキストマイニング : 文学における発見を支援する
- 平衡直線的プログラムに対するパターン照合アルゴリズム
- 類似歌抽出に基づく歌集の成立年代推定
- 2000-CH-47-6 歌集間における表現特徴の自動抽出 : 部分文字列の生起頻度にみる
- 単語の頻度情報の偏りを用いた文書の自動分類手法の提案
- 科学技術文における共起情報を用いた関連語の抽出
- 2000-CH-46-3 / 2000-MUS-35-3 主旋律の類似性について
- 2000-CH-46-3 / 2000-MUS-35-3 主旋律の類似性について
- 和歌データからの類似歌発見のための類似性指標について
- 2G-2 圧縮テキストに対する文字列照合のための統一的枠組み
- 2G-1 データ圧縮による文字列照合の高速化
- 5G-2 音符列比較における類似性指標の評価
- 英文科学技術文における動詞の意味的分類
- 英文CISGの格構造化手続きの開発
- 英文科学技術文における前置詞を伴う動詞句の決定
- 英文科学技術文における単純名詞句の範囲決定
- 圧縮テキストに対するパターン照合機械の高速化
- SVMによるバイパータイトランキング学習を用いたコンピュータ将棋における評価関数の学習(IBIS2010(情報論的学習理論ワークショップ))
- コンピュータは文学研究を変えるか?
- 2.情報爆発時代のための新しい超高速アルゴリズム(パートI:情報爆発時代における新しい基盤技術,情報爆発時代におけるわくわくするITの創出を目指して)
- 1Q-4 図書目録イメージデータの検索システム
- 1Y-8 重み付き分類規則による保健データからのデータマイニング(情報システムの分析・設計・評価,一般講演,コンピュータと人間社会)
- ピクチャ・パターン照合アルゴリズム(計算アルゴリズムと計算量の基礎理論)
- 人文科学と情報科学の学際的研究のために
- 人文科学とコンピュータの学際的研究とは
- 情報検索システムAIRの実現
- 情報検索システムにおける高頻度キーワードの文書参照ファイルの圧縮について
- 情報検索システムにおける文書参照ファイル
- 和歌データベースにおける特徴パターンの発見 (人文科学とコンピュータ)
- 和歌データベースにおける類似歌の発見
- MDL 原理を用いた和歌データからのパターン抽出
- A-025 非可逆圧縮を用いた類似性指標と画像検索への応用(A分野:モデル・アルゴリズム・プログラミング,一般論文)
- 固定文字と文字種の混在するパターンを対象としたAho-Corasick型パターン照合機械の構成法
- A-024 信頼区間上限の不確実性サンプリングへの応用(A分野:モデル・アルゴリズム・プログラミング,一般論文)
- 5N-2 文字列に含まれる繰り返し構造の頻度について(アルゴリズム,学生セッション,ソフトウェア科学・工学,情報処理学会創立50周年記念)
- DS-1-6 例数制限付き教示の複雑さ(DS-1.計算理論における学生の研究パワー:COMP学生シンポジウム,シンポジウムセッション)
- DS-1-5 非終端記号を導入した基本形式体系の言語記述力について(DS-1.計算理論における学生の研究パワー:COMP学生シンポジウム,シンポジウムセッション)
- 置換のランク付けに対する$O$($n$log log$n$)ビット領域の線形時間アルゴリズム (理論計算機科学の深化と応用)
- 例数制限付き教示の複雑さ (理論計算機科学の深化と応用)
- 3R-2 通信規約学習の拡張による協調精度の向上(学習,学生セッション,人工知能と認知科学)
- 1V-3 間引きを用いたパス技術の自律学習(学習・推論,学生セッション,人工知能と認知科学)
- 圧縮テキスト上での文字列照合アルゴリズム
- LZW圧縮テキストに対する高速文字列照合アルゴリズム
- ALT '94報告
- イメージデータ化された図書目録カードの検索システム
- 電子マネーシステムの価値保存形式を考慮したモデル化(Session 3)
- 圧縮文字列上での $q$-gram 頻度の高速な計算方法 (計算機科学とアルゴリズムの数理的基礎とその応用)
- 確率的評価値をもつゲーム木における最善手探索 (計算機科学とアルゴリズムの数理的基礎とその応用)
- DS-1-12 文字列に含まれる連構造(DS-1.COMP学生シンポジウム,シンポジウムセッション)
- 英文科学技術文における高頻度名詞の分類について
- 単語の品詞とその被修飾度および前方修飾度との関係について
- 英文科学技術文における前方修飾語の決定について
- イベント列データにおけるVLDCエピソード生成モデル (「メディアとAI」および一般)
- 半導体歩留り解析に回帰木分析を適用するための仮説検証手法の提案
- 非線形コラージュシステムにおける文字列パターン照合
- 非線形テキストにおける最長共通部分文字列・部分列アルゴリズム
- マルチトラック文字列の順列パターン照合と索引構造