幾何的接尾辞木 : タンパク質3次元構造検索のための新しい索引構造(セッション1)
スポンサーリンク
概要
- 論文の詳細を見る
タンパク質構造解析はポストゲノム時代の非常に重要な研究分野であり、非常に多くのタンパク質構造が次々と解明されるに従いより高速でより正確な3次元構造検索のための索引構造を設計することが急務となっている。本論文ではタンパク質3次元構造を検索するための幾何的接尾辞木と名づけた新しい索引構造を提案する。このデータ構造を用いることで、クエリーとする3次元構造に対して、RMSD (root mean square deviation)あるいはURMSD (unit-vector root mean square deviation)とよばれる指標による指定値以上に類似するデータベース中のタンパク質の3次元構造の部分構造を効率的にすべて列挙することができる。データベースのサイズをnとするとそれに含まれる部分構造はO(n^2)存在するにも関わらず、幾何的接尾辞木を記憶するのに必要なメモリサイズはO(n)である。また、このデータ構造はナイーブに構築するとO(n^3)の計算が必要であるが、本論文ではO(n^2)の構築アルゴリズムを提案する。さらに効率的な検索アルゴリズムも提案する。最後に簡単な計算機実験を通じてこのデータ構造の有用性を検証する。
- 2006-03-17
著者
関連論文
- 線形時間タンパク質3次元構造探索アルゴリズム
- 効率的な部分構造RMSD問い合わせブルゴリズム
- タンパク質ヒンジ構造検出のための高速かつ正確なアルゴリズム
- 接頭辞並べ替え幾何的接尾辞木
- バイオインフォマテイクスの現状と課題(学生/教養のページ)
- 分子合成経路発見のためのグラフタイリングアルゴリズム(セッション2)
- 幾何的接尾辞木 : タンパク質3次元構造検索のための新しい索引構造(セッション1)
- 複数生物学的配列のアラインメントのパラメトリック的考察
- 複数の生物学的配列の準最適アラインメントについて
- Spaced Seedの検索のための索引