タンパク質立体構造の配列および原子間距離による分類と非冗長化されたPDB代表タンパク質チェインデータベース(PDB-REPRDB)の作成
スポンサーリンク
概要
- 論文の詳細を見る
タンパク質立体構造データベース(PDB)は, 近年のX線結晶回折やNMRによる構造解析技術の進歩により, その内容は現在約7,500エントリー(3.4Gbytes)を越え, 今後もさらに増え続けると予想されている. しかしながら, 冗長性やデータの不完全性のためにPDBの全てのエントリーがタンパク質の立体構造の解析に適しているとは言えず, 何らかの基準で代表タンパク質を決定する必要がある. この代表を決定するには, 各エントリーの内容を調べ, 解析に適さない質の悪いデータを除去したり, 各エントリーに対して他のエントリーが配列的および立体構造的に類似のタンパク質かどうかを調べあげ, 分類を行なわなければならない. タンパク質立体構造データの分類は, 立体構造の取扱いの困難さとそれに基づく分類に膨大な計算が必要なため, 近似的に配列の類似性(ID%)だけを指標にして行なわれてきた. 我々は, 従来のID%による分類に, タンパク質分子を重ね合わせた時に対応する原子間距離の最大値(Dmax)を分類の指標として加え, 従来よりも正確な分類を可能にしたPDBの代表タンパク質決定システムを開発した. 本論文では, 本システムをMPIライブラリを用いて並列化し, 新しい分類指標の追加に伴う計算量増加の問題を解決した. 本研究で実装した並列版では, 従来の約110倍の高速化を実現し, およそ1週間を必要としていた代表タンパク質決定処理を約1.5時間で実行できるようになった. 我々は, 本手法を用い, 様々なID%とDmaxの値の組合せでPDBのチェインを分類し, 代表を決定した"PDB代表タンパク質チェインデータベース(PDB-REPRDB)"をPDBのリリースごとに作成している. 本データベースをWWWで公開し, 既に世界から2,200回以上アクセスされている.
- 一般社団法人情報処理学会の論文
- 1999-02-15
著者
-
秋山 泰
技術研究組合新情報処理開発機構
-
鬼塚 健太郎
技術研究組合新情報処理開発機構
-
野口 保
技術研究組合新情報処理開発機構
-
安藤 誠
技術研究組合新情報処理開発機構
-
安藤 誠
新情報処理開発機構
-
安藤 誠
日本鋼管株式会社情報システム部:産業技術総合研究所生命情報科学研究センター:大阪大学大学院基礎工学研究科情報数理系専攻
-
野口 保
技術研究組合 新情報処理開発機構
-
秋山 泰
産総研・cbrc
-
秋山 泰
産業技術総合研究所生命情報科学研究センター
-
秋山 泰
技術研究組合新情報処理開発機構つくば研究センタ
-
鬼塚 健太郎
技術研究組合 新情報処理開発機構
関連論文
- 並列化Barnes-Hut Tree Codeを用いた高精度なタンパク質分子動力学法プログラムの開発(並列処理)
- アミノ酸配列のマルチプルアライメントにおける反復改善過程の並列化とA^*アルゴリズムの適用
- 分子動力学法プログラムAMBERとBarnes-Hut tree codeの並列化による高速化 (並列処理)
- 並列タンパク質情報解析(PAPIA)システムのPCクラスタ上での実現
- 分子動力学法プログラムAMBERとBarnes-Hut tree codeの並列化と性能評価
- アミノ酸配列のマルチプルアライメント計算におけるA^*アルゴリズムの適用の効果
- タンパク質立体構造研究支援のための並列統合解析システムの構築
- A^*アルゴリズムを適用した並列反復改善法によるマルチプルアライメント
- 蛋白質立体構造データベース(PDB)の代表蛋白質決定システムの並列化
- 宇宙プラズマ粒子シミュレーションの並列化
- 多次元分布の線形基底変換による圧縮表現の提案, 及びタンパク質残基間相対位置分布への応用
- 多次元分布の線形基底変換による圧縮表現の提案、及びタンパク質残基間相対位置分布への応用
- 大規模分子動力学シミュレーションによる自由エネルギー地形解析システムの開発(セッション3:『バイオモデリング,シミュレーション』)
- 2P049 プリオンタンパク質の疾病関連遺伝子置換P102Lのダイナミクスに与える影響について(蛋白質 A) 構造)
- Ab initioペア近似法による並列分子軌道計算プログラムABINIT-MPの作成と性能評価
- 分子動力学法に基づくタンパク質構造サンプリングとドッキング予測の改良
- 中赤外自由電子レーザーを用いたペプチド・糖鎖フラグメント解析
- Human Prion Protein(Hu PrP)monomerとdimerの分子動力学シミュレーションによる解析
- SMPクラスタ向けネットワーク・インタフェース上AM通信
- SMPクラスタでの共有/分散融合プログラミング
- 階層的な大規模並列木探索によるタンパク質立体配座解析システムESCAPE/Hi
- 並列木探索によるタンパク質立体配座解析の階層的アプローチによる拡張
- タンパク質分子構造を例とする高性能計算結果の可視化システムの試作
- 大規模PCクラスタを用いたインターネット上の公開計算サービス : 並列タンパク質情報解析(PAPIA)システムの構築と利用実績
- 大規模PCクラスタを用いたインターネット上の公開計算サービス : 並列タンパク質情報解析(PAPIA)システムの構築と利用実績
- タンパク質立体構造の配列および原子間距離による分類と非冗長化されたPDB代表タンパク質チェインデータベース(PDB-REPRDB)の作成
- 木探索アプローチによるタンパク質立体配座解析と大規模並列計算機上での高速解析システムの構築
- 多次元分布の線形変換による圧縮表現のタンパク質立体構造認識問題への応用
- タンパク質立体構造の配列および原子間距離による分類を非冗長化されたPDB代表タンパク質チェインデータベース(PDB-REPRDB)の作成
- 木探索アプローチによるタンパク質立体配座解析と大規模並列計算機上での高速解析システムの構築
- 並列木探索を用いたタンパク質立体配座解析システムの構築
- Knapsack問題における共有メモリ型/分散メモリ型並列計算機の性能比較
- フラグメントMO法によるノイラミニダーゼ阻害薬の結合性解析
- 2 バイオインフォマティクス研究者スキル(バイオインフォマティクス)
- インタビュー 独立行政法人 産業技術総合研究所 生命情報科学研究センター 先進的かつ独創的な研究プロジェクトを、22.8Tflop/sのスーパーコンピューターが支援
- 2P080 Reaction Mechanism of Nitric Oxide Reductase Cytochrome P450nor from Fusarium oxysporum
- 細胞アレイのための大規模画像処理システムの開発
- 大規模並列計算機によるタンパク質情報解析 (「分子生物情報学の新展開」)
- エントロピー項の導入によるバックプロパゲーション学習則の拡張と学習効率の向上
- エントロピー項の導入によるバックプロパゲーション学習則の拡張と学習効率の向上
- 1P241 タンパク質立体構造予測パイプラインFORTE-SUITE向け網羅的モデリング・構造評価システム(生命情報科学(構造ゲノミクス),ポスター発表,第45回日本生物物理学会年会)
- 3P273 CoLBA : 相互作用比較を考慮したリガンド結合予測法の開発(生命情報科学 A) 構造ゲノミクス)
- Erwin Schrodinger: What is Life?(20世紀の名著名論)
- バイオインフォマティクスと人工知能の相互作用(バイオインフォマティクスと人工知能の新たなインタラクション)
- 特集「バイオインフォマティクスと人工知能の新たなインタラクション」にあたって(バイオインフォマティクスと人工知能の新たなインタラクション)
- 分散環境におけるシームレス並列コンピューティングシステムの構想
- マルチシナリオゲームにおける並列世界のモデル
- バイオインフォマティクス : 情報システムとしての生命現象の理解へ
- 並列タンパク質情報解析(PAPIA)システム
- WWWによる研究支援