極小かつ非冗長な可変長ワイルドカード領域をもつ頻出パターンの抽出(テキストマイニング,<特集>データ工学論文)
スポンサーリンク
概要
- 論文の詳細を見る
筆者らは,分子配列データベースから生物学的に重要な機能をもつ特徴的なパターンであるモチーフの候補である頻出パターンを抽出するために,極小な可変長ワイルドカード領域をもつ頻出パターンを導き出す方法を提案する.この方法は,κ-頻出パターン(長さκの頻出パターン)から(κ+1)-頻出パターンを生成するパターン成長アプローチを拡張し,κ-頻出パターンごとにスコープデータベースを作成する.κ-頻出パターンのスコープデータベースは,従来の射影データベースに含まれるスキャン開始位置の情報に,ユーザにより定められた参照範囲の情報とそれまでに求まった可変長のκ-頻出パターンに対するすべてのオカーレンスの情報を加えている.これにより,抽出される可変長の(κ+1)-頻出パターンの可変長ワイルドカード領域が非極小,または冗長になることを回避することができる.スコープデータベースの有効性を示すため,PROSITEからLeucine Zipperモチーフ及びZinc Fingerモチーフを含むデータセットをそれぞれ取り出し,各データセットに対して可変長の頻出パターンを抽出する能力の評価を行ったので,その結果を報告する.
- 社団法人電子情報通信学会の論文
- 2007-02-01
著者
-
森 康真
広島市立大学大学院情報科学研究科
-
田村 慶一
広島市立大学大学院情報科学研究科
-
北上 始
広島市立大学大学院情報科学研究科
-
加藤 智之
広島市立大学大学院情報科学研究科
-
森康 真
広島市立大学情報科学研究科
-
黒木 進
広島市立大学大学院情報科学研究科
-
森 康真
広島市立大学情報科学研究科
-
北上 始
広島市立大学大学院
-
黒木 進
広島市立大学大学院
-
田村 慶一
広島市立大学大学院
関連論文
- 段階的一般化法によるミスマッチクラスタを表現する最小汎化集合の効率的抽出(情報抽出,データ工学論文)
- ブログユーザ空間からの重複を許した頻出コミュニティ抽出法
- 3次元CGモデルのOODBMSによる実装
- 3次元アニメーションデータベースシステムMOVEの基本設計とその評価
- DNAデータベースの構築と検索
- 4次元空間データベースシステム Hawks における4次元空間表現
- 4次元空間データベースシステムHawksにおける4次元空間データ型の設計 (時空間データベース)
- 時空間データベースUniverseにおける物体表現
- マルチメディア4次元データベースにおける空間質問処理モジュールの設計
- マルチメディア4次元データベースの空間データモデルの設計
- ギブスサンプリングとアラインメント処理に基づく類似部分配列の抽出方式
- ギブスサンプリングとアラインメント処理に基づく類似部分配列の抽出方式
- Gibbs-DMGGによる類似部分配列の抽出方式
- 意味的な異種性を有する生物分類樹データベースの統合化方式 (高度データベース論文特集)
- 意味的な異種性をもつ自律的な分類データベースの統合化方式
- 生物分類樹データベースに対する再帰質問検索
- ブログユーザ空間からの重複を許した頻出コミュニティ抽出法(セッション3)
- 頻出コミュニティのブログユーザ空間からの抽出手法
- ネットワーク構造解析に基づく重複クラスタ抽出法(セッション3:データマイニング)
- ネットワーク構造解析に基づく重複クラスタ抽出法(セッション3:データマイニング)
- ミスマッチクラスタを表現する最小汎化集合の高速抽出
- ミスマッチクラスタを表現する最小汎化集合の高速抽出
- 分散並列環境におけるディスクベースサフィックス木の構築と検索
- Extremal Optimizationによる調停グラフの交差数減少
- Extremal Optimizationを用いた調停グラフの交差数減少(セッション3)
- 極小かつ非冗長な可変長ワイルドカード領域をもつ頻出パターンの抽出(テキストマイニング,データ工学論文)
- グリッド環境下での分散型ワーカモデルを用いたModified PrefixSpan法の動的負荷分散方式
- 可変長ワイルドカード領域を持つ極小な頻出配列パターンの抽出
- 極小な可変長ワイルドカード領域を持つ頻出配列パターンの抽出
- PCクラスタにおける混合整数計画問題の並列処理とその性能評価
- Modified PrefixSpan法の並列化と動的負荷分散手法
- PCクラスタにおける混合整数計画問題の並列処理とその性能評価
- 感情に基づく音楽作品検索システムの実現に向けての検討
- 感情に基づく音楽作品検索システムの実現に向けての検討
- A-001 マルチコア計算機クラスタ上における段階的一般化法の並列処理(A分野:モデル・アルゴリズム・プログラミング,一般論文)
- Gibbs-DMGG による類似部分配列の抽出方式
- 配列からの頻出パターン抽出のためのWebシステム (知識ベースシステム研究会(第60回) 人工知能基礎論研究会(第52回) 小特集:「データマイニング」および一般) -- (アクティブマイニング特集)
- 階層的管理機能を持つアンケート実施支援システムの構築
- 並列Modified PrefixSpan法における動的負荷分散手法
- Modified PrefixSpan法を用いた頻出正規パターンの抽出をめざして
- 配列からの頻出パターン抽出のためのWebシステム
- 配列からの頻出パターン抽出のためのWebシステム(「アクティブマイニング」及び一般)
- 配列からの頻出パターン抽出のためのWebシステム (知識ベースシステム研究会(第60回) 人工知能基礎論研究会(第52回) 小特集:「データマイニング」および一般) -- (アクティブマイニング特集)
- F-25 クラシック曲のダイジェスト生成法の提案(音楽情報科学(2),F.音声・音楽)
- (47)Webを用いた授業アンケート実施支援システムの開発(教育評価(I),第12セッション)
- 学習者の状態遷移モデルを考慮した演習支援用の Web システムの開発と運用
- 旋律の音高変化に基づく楽曲特徴量についての検討
- Reducing Crossovers in Reconciliation Graphs Using the Coupling Cluster Exchange Method with a Genetic Algorithm (人工知能基礎論研究会(第46回) 知識ベースシステム研究会(第54回) 合同研究会 テーマ:「アクティブマイニング」および一般)
- Reducing Crossovers in Reconciliation Graphs Using the Coupling Cluster Exchange Method with a Genetic Algorithm (人工知能基礎論研究会(第46回) 知識ベースシステム研究会(第54回) 合同研究会 テーマ:「アクティブマイニング」および一般)
- 授業改善のために行うアンケート実施支援システムの実現
- 二種類の順序木より成る有向グラフの交差数減少法について
- (6)学習者の状態遷移モデルを考慮した演習支援用のWebシステムの開発と運用(第2セッション 教育システム(II))
- クラスタ分析に基づく画像の分類と閲覧のためのインタフェース
- 異種木構造データベースの調停に対する制約ソルバー
- 異種系統樹間の調停のためのゼロ交差制約の充足
- 生物分類デ-タと分子進化デ-タを関係付けるための系統樹マッチング
- 分子生物学デ-タベ-スにおけるデ-タマイニングについての一考察
- (29)World-Wide Webを用いたデータベースシステムの教育(第8セッション コンピュータ援用教育(III))
- 生物分類樹データベースにおける履歴推論
- 生物分類樹データベースにおける履歴推論
- 分散処理環境における生物分類樹データベースの統合化を目ざして
- 3次元空間データベースの空間インデックスの実装と評価
- アニメーションデータベースMOVEのための空間インデックスの設計
- 時空間データベースシステムHawksのR^*-treeによる領域検索の高速化
- 拡張凸胞複体を基盤とする空間データ表現モデルとその地理情報データベースへの応用
- 図形タイプのデータベースへの導入とその応用 : 序論
- 図形タイプのデータベースへの導入とその応用-序論-
- 位相空間データモデルUniverseでの空間, 時間, 時空間データ表現
- 時空間データベースインデックス正規化R^*-treeの実装と性能テスト
- 凸胞複体表現されたd次元多面体の集合演算アルゴリズム
- d次元多面体の集合演算アルゴリズム
- 位相空間データモデルでUniverseの空間, 時間, 時空間データ表現
- 時空間データモデルUniverseにおける時空間データの集合演算アルゴリズムの設計
- 時空間OQLにおける時空間述語の定義
- 時系列ブログデータからの知識発見に関する研究 : データマイニングの立場から
- ブログデータ集合からの頻出なコミュニティ抽出手法
- 3-101 大学等における次世代一般情報処理教育の試行((1)基礎科目(数学,物理学,科学,生物学など)の講義・演習-I)
- 可変長配列パターン抽出法におけるギブスサンプリングを用いた不要パターンの除去方式
- アニメーションデータベースシステムM0VEにおける動きの格納と検索法
- 単体複体の概念を用いた時空間データモデルUniverseの設計
- 単体複体の概念を用いた時空間データモデルUniverseの設計
- アニメーションデータベースシステムMOVEの実装
- 時空属性を持つオブジェクトベースMOVE
- アニメーションデータベースシステムMOVEのアニメーションモデリング
- 並列Modified PrefixSpan法の設計と実装
- 時空間データベースシステムHawksにおける時空間質問の表現
- 時空間データベースシステムHawksにおける時空間質問の表現
- 異機種分散環境で動作するデータベースサーバ「出世魚」とその実現
- Implicit LockとExplicit Lockの混在を許すオブジェクトデータベース管理システム「出世魚」におけるページロックメカニズム
- 三次元 R-tree のための三次元空間データ表現の比較
- WWWを用いたデータベースシステムの教育
- 音楽データを対象としたイメージ検索のための感情価の自動生成
- マルチメディアデータベース : 現状と課題
- 幾何学的なサフィックス木による高速類似構造検索手法
- CMO問題に対する改良版EOを用いた発見的解法
- Education of Database Systems Using WWW
- 幾何学的サフィックス木に対する並列処理性能の評価
- 幾何学的サフィックス木に対する並列処理性能の評価