非線形テキストにおける最長共通部分文字列・部分列アルゴリズム
スポンサーリンク
概要
- 論文の詳細を見る
非線形テキストは,文字列を頂点ラベルとする有向グラフである.本論文では,二つの非線形テキストに対して,その類似性を調べる為に,二つの非線形テキストにおける最長共通部分文字列問題と最長共通部分列問題を定義し,サイクルを含まない非線形テキストに対し,O(|E||E_2|)時間での解法を提案する.ここで,|E|,|E_2|は二つの非線形テキストG_1,G_2のそれぞれの辺の数を表す.また,サイクルを含む非線形テキストにおける最長共通部分列問題のO(|E_1|+|E_2|+|E'_1||E'_2|+|V'_1||V'_2|log|Σ|+|Σ|log|Σ|)時間での解法を提案する.ここで,|Σ|はアルファベットサイズE'_1,E'_2,V'_1,V'_2はそれぞれG_1,G_2をサイクルを一つの頂点と見なし,変形した後の辺の数と頂点数を表す.
- 2011-05-04
著者
-
稲永 俊介
九州大学大学院システム情報科学研究院
-
竹田 正幸
九州大学大学院システム情報科学研究院
-
坂内 英夫
九州大学大学院システム情報科学府情報理学専攻
-
坂内 英夫
九大
-
竹田 正幸
九州大学大学院システム情報科学府情報学専攻
-
下平 浩二
九州大学大学院システム情報科学府
-
稲永 俊介
九州大学 大学院システム情報科学研究院
-
坂内 英夫
九州大学大学院システム情報科学府
-
竹田 正幸
九州大学大学院システム情報科学府
関連論文
- オンラインランク統合問題 (アルゴリズムと計算機科学の数理的基盤とその応用)
- 楽曲の分類と文字列間の類似性指標について (特集 「脳科学と知識処理」および一般)
- 『恵慶法師集』比良歌群試注
- 九州大学における一般情報処理教育支援システムについて
- 古典和歌からの知識発見 : モビルスーツを着た国文学者(失われゆく情報の復元・保存技術 : 人文科学における情報処理(文献学・データベース共有・史科編纂))
- 質問学習における学習可能性の統一的特徴づけ
- 圧縮文字列における最長共通部分文字列および回文を求める多項式時間アルゴリズム
- 平衡直線的プログラムで圧縮された文字列の非反復性検証アルゴリズム
- WindowsマシンにおけるSeepの実装
- 国文学の研究教育における機械学習応用(機械学習の科学研究への応用)
- 最大エントロピー原理に基づくオンライン学習 (理論計算機科学の深化と応用)
- 非定常な木情報源に対応する文脈木重みづけ法に関する研究
- Online Learning of Approximate Maximum $p$-Norm Margin Classifiers with Bias (Foundations of Theoretical Computer Science : For New Computational View)
- 漸増的なパストライ構築に基づく高速・軽量XML文書フィルタリング(夏のデータベースワークショップ2007(データ工学,一般))
- 漸増的なパストライ構築に基づく高速・軽量XML文書フィルタリング(テキスト検索,夏のデータベースワークショップ2007(データ工学,一般))
- 文字列の圧縮とパターンの照合・発見(「自動化:推論,発見,学習,データマイニング」及び一般)
- 定数項の大きな線形しきい値関数に対する高速なオンライン学習(計算機科学の理論とその応用)
- 接尾辞配列による効率的な文字列上の同値類計算
- 物名十干部試注
- 医薬品の取り違えミスを防止するための薬名類似度の定量的指標の構築
- 浅香山恋部試注
- 浅香山秋冬部試注
- 秋部試注
- 日本産昆虫総目録のデータベース化について
- 和歌データベースからの類似歌の自動抽出
- 九州大学自己点検・評価関連情報システム(セッション2:XML応用システム)
- ストリーム指向のXQuery処理システムについて(セッション4 : XML・構造化文書の蓄積とアクセス)
- ストリーム指向のXQuery処理システムについて(セッション4 : XML・構造化文書の蓄積とアクセス)
- 長さ優先置換による文字列圧縮の線形時間アルゴリズム(文字列アルゴリズム)
- 高速一方向逐字処理技術に基づくXML文書の検索と変換(セッション3:デジタルコンテンツ管理技術)
- D-28 文字列照合技術に基づくXMLデータ処理(XMLデータ処理,D.データベース)
- 圧縮されたテキスト上のパターン照合 : データ圧縮とパターン照合の新展開
- 極大共通生垣を用いた情報抽出手法の提案
- 極大共通生垣を用いた情報抽出手法の提案
- 古典和歌における反復表現の諸相
- 断片パターンマッチングの計算量的困難性と近似アルゴリズムについて
- 古典和歌集からのテキストマイニング
- 英文科学技術文における単純名詞句決定法の比較
- 英文科学技術文における単純名詞句決定法の比較
- TD-1-5 文学作品からのテキストマイニング : 文学における発見を支援する
- 平衡直線的プログラムに対するパターン照合アルゴリズム
- 類似歌抽出に基づく歌集の成立年代推定
- 2000-CH-47-6 歌集間における表現特徴の自動抽出 : 部分文字列の生起頻度にみる
- 単語の頻度情報の偏りを用いた文書の自動分類手法の提案
- 科学技術文における共起情報を用いた関連語の抽出
- 2000-CH-46-3 / 2000-MUS-35-3 主旋律の類似性について
- 2000-CH-46-3 / 2000-MUS-35-3 主旋律の類似性について
- 和歌データからの類似歌発見のための類似性指標について
- 2G-2 圧縮テキストに対する文字列照合のための統一的枠組み
- 2G-1 データ圧縮による文字列照合の高速化
- 5G-2 音符列比較における類似性指標の評価
- 英文科学技術文における動詞の意味的分類
- 英文CISGの格構造化手続きの開発
- 英文科学技術文における前置詞を伴う動詞句の決定
- 英文科学技術文における単純名詞句の範囲決定
- 圧縮テキストに対するパターン照合機械の高速化
- SVMによるバイパータイトランキング学習を用いたコンピュータ将棋における評価関数の学習(IBIS2010(情報論的学習理論ワークショップ))
- コンピュータは文学研究を変えるか?
- F-036 Online Rank Aggregation
- 2.情報爆発時代のための新しい超高速アルゴリズム(パートI:情報爆発時代における新しい基盤技術,情報爆発時代におけるわくわくするITの創出を目指して)
- 1Q-4 図書目録イメージデータの検索システム
- 情報検索システムAIRの実現
- 情報検索システムにおける高頻度キーワードの文書参照ファイルの圧縮について
- 情報検索システムにおける文書参照ファイル
- 和歌データベースにおける特徴パターンの発見 (人文科学とコンピュータ)
- 和歌データベースにおける類似歌の発見
- MDL 原理を用いた和歌データからのパターン抽出
- F-037 Sparse Substring Pattern Set Discovery using Linear Programming Boosting
- A-016 Verifying a Parameterized Border Array in O(n^) Time
- 固定文字と文字種の混在するパターンを対象としたAho-Corasick型パターン照合機械の構成法
- LZW圧縮テキストに対する高速文字列照合アルゴリズム
- イメージデータ化された図書目録カードの検索システム
- 電子マネーシステムの価値保存形式を考慮したモデル化(Session 3)
- 圧縮文字列上での $q$-gram 頻度の高速な計算方法 (計算機科学とアルゴリズムの数理的基礎とその応用)
- 確率的評価値をもつゲーム木における最善手探索 (計算機科学とアルゴリズムの数理的基礎とその応用)
- DS-1-10 文字列パターン上の同値関係と飽和パターンの列挙(DS-1.COMP学生シンポジウム,シンポジウムセッション)
- Practical Algorithms for Pattern Based Linear Regression (テーマ:特集「シンボルグラウンディング問題」および一般)
- 類似性指標を用いた楽曲のジャンル分類 (「メディアとAI」および一般)
- 英文科学技術文における高頻度名詞の分類について
- 単語の品詞とその被修飾度および前方修飾度との関係について
- 英文科学技術文における前方修飾語の決定について
- SVMによるバイパータイトランキング学習を用いたコンピュータ将棋における評価関数の学習
- 非線形コラージュシステムにおける文字列パターン照合
- 2単語科学技術用語の英日翻訳について
- 科学技術用語における2単語句の英日翻訳規則
- 非線形テキストにおける最長共通部分文字列・部分列アルゴリズム
- 英文科学技術抄録文における高頻度動詞の格フレームに関する調査
- EDR概念体系辞書における上位-下位関係の推移的閉包の効率的検索
- 非定常な木情報源に対応する文脈木重みづけ法に関する研究
- マルチトラック文字列の順列パターン照合と索引構造
- 類似度に基づくポリフォニックな楽曲の分類
- SVMによる2部ランキング学習を用いたコンピュータ将棋における評価関数の学習(情報・システム基礎)