Suffix arrayを用いた高速な配列相同性検索の改良とエピゲノム解析への対応
スポンサーリンク
概要
- 論文の詳細を見る
我々は以前に suffix array を用いた高速な相同性検索システムを提案したが,近年の次世代シークエンサーの進歩が目覚ましく,得られる配列データは増加しており,さらなる高速化が必要とされている.このため,本研究では従来システムの改良を試み,長さ L hash のすべての文字列の suffix array の検索結果を予め計算しておき,これを保存しておく.そして,検索の際は L hash 文字目までの検索には保存しておいたものを読み出すことで高速化した.また,このシステムを用いてエピゲノム解析へも対応するために,バイサルファイト処理を行った DNA 断片配列のマッピングができるように改良を行った.
- 2012-06-21
著者
-
石田 貴士
東京工業大学大学院情報理工学研究科計算工学専攻
-
鈴木 脩司
東京工業大学大学院情報理工学研究科計算工学専攻
-
石田 貴士
東京工業大学 大学院情報理工学研究科
-
秋山 泰
東京工業大学 大学院情報理工学研究科 計算工学専攻
-
鈴木 脩司
東京工業大学大学院情報理工学研究科
-
秋山 泰
東京工業大学 大学院情報理工学研究科
関連論文
- GPUによるDNA断片配列の高速マッピング (ニューロコンピューティング)
- GPUによるDNA断片配列の高速マッピング (非線形問題)
- バイオインフォマティクスの動向
- 単純ベイズ確率モデルの導入による天然変性蛋白質領域予測の改良 (ニューロコンピューティング)
- 単純ベイズ確率モデルの導入による天然変性蛋白質領域予測の改良 (非線形問題)
- Ab initioペア近似法による並列分子軌道計算プログラムABINIT-MPの作成と性能評価
- 最長共通部分列に基づくDNA配列の高速クラスタリング
- FM-indexを用いた高速な配列相同性検索ツールの開発
- 最長共通部分列に基づくDNA配列の高速クラスタリング
- FM-indexを用いた高速な配列相同性検索ツールの開発
- MEGADOCK:立体構造情報からの網羅的タンパク質間相互作用予測とそのシステム生物学への応用
- GPUによるDNA断片配列の高速マッピング
- ウェブアプリケーションによる薬物クリアランス経路予測
- タンパク質ドッキング予測プログラムによるシグナル伝達系のタンパク質間相互作用解析(一般セッション2)
- タンパク質間相互作用予測のためのドッキング後処理システムの開発(一般セッション2)
- 単純ベイズ確率モデルの導入による天然変性蛋白質領域予測の改良
- 1P188GPCRに特化した網羅的遺伝子発見システム:ヒトゲノムへの応用
- MEGADOCK:立体構造情報からの網羅的タンパク質間相互作用予測とそのシステム生物学への応用
- タンパク質の特性に基づくunboundドッキングのための剛体予測手法の改良
- リランキングを用いたタンパク質ドッキングの精度向上と網羅的タンパク質間相互作用予測への応用
- 網羅的タンパク質間相互作用予測システムにおける判別精度の改良
- 分子動力学法に基づくタンパク質構造サンプリングとドッキング予測の改良
- 物理化学的相互作用の導入による網羅的タンパク質間相互作用予測システムの高精度化
- SVMを用いた薬物クリアランス経路予測システムの開発-複数経路予測への拡張と外部データによる評価-
- ブースティングによる薬物クリアランス経路予測
- フラグメントMO法によるノイラミニダーゼ阻害薬の結合性解析
- 結晶スクリーニング結果を活用した機械学習による結晶化条件の予測モデルアレイ(学習によるバイオデータマインニング・生命現象の非線形性,機械学習によるバイオデータマインニング・生命現象の非線形性,一般)
- 結晶スクリーニング結果を活用した機械学習による結晶化条件の予測モデルアレイ(機械学習によるバイオデータマインニング・生命現象の非線形性,機械学習によるバイオデータマインニング・生命現象の非線形性,一般)
- 結晶スクリーニング結果を活用した機械学習による結晶化条件の予測モデルアレイ(3研究会合同企画セッション[2])
- 機械学習を用いた薬物のクリアランス経路予測(3研究会合同企画セッション[2])
- 機械学習を用いた薬物のクリアランス経路予測(学習によるバイオデータマインニング・生命現象の非線形性,機械学習によるバイオデータマインニング・生命現象の非線形性,一般)
- 機械学習を用いた薬物のクリアランス経路予測(機械学習によるバイオデータマインニング・生命現象の非線形性,機械学習によるバイオデータマインニング・生命現象の非線形性,一般)
- パイロシーケンシング法で決定されたDNA配列の読み取り誤差の訂正
- パイロシーケンシング法で決定された DNA 配列の読み取り誤差の訂正
- 1P174膜貫通ヘリックスを繋ぐループセグメントの解析
- GPUを用いた配列相同性検索ツールのマルチGPU向け最適化
- GPUを用いた高速な配列相同性検索のsuffix arrayによる改良 (ニューロコンピューティング)
- 能動学習法を利用した薬物クリアランス経路予測の改良(合同企画セッション:バイオデータマイニング,機械学習によるバイオデータマインニング,一般)
- タンパク質間相互作用予測における可視化手法の開発および予測精度の改善(一般講演(バイオ情報学),機械学習によるバイオデータマインニング,一般)
- ドッキング計算に基づく網羅的タンパク質-RNA間相互作用予測(一般講演(バイオ情報学),機械学習によるバイオデータマインニング,一般)
- GPUを用いた高速な配列相同性検索のsuffix arrayによる改良(一般講演(バイオ情報学),機械学習によるバイオデータマインニング,一般)
- Suffix arrayを用いた高速な配列相同性検索の改良とエピゲノム解析への対応
- タンパク質間ドッキング予測における目的関数の機械学習を用いた動的調整
- 簡易疎水性相互作用モデルによるタンパク質間ドッキング予測の高精度化
- タンパク質ドッキング予測における実空間での効率的な評価スコア計算方法の研究
- ハッシュテーブルの分割によるde novoアセンブリの改良
- タンパク質間ドッキング予測における目的関数の機械学習を用いた動的調整 (ニューロコンピューティング)
- 簡易疎水性相互作用モデルによるタンパク質間ドッキング予測の高精度化 (ニューロコンピューティング)
- Suffix arrayを用いた高速な配列相同性検索の改良とエピゲノム解析への対応 (ニューロコンピューティング)
- 次世代シークエンサーから得られる大量メタゲノム情報の解析のための超高速パイプライン
- MEGADOCKを用いたタンパク質間相互作用予測のヒトアポトーシスパスウェイ解析への応用
- MEGADOCKを用いたタンパク質間相互作用予測のヒトアポトーシスパスウェイ解析への応用
- 構造情報に基づくタンパク質間相互作用ネットワーク予測精度の改善
- De Bruijn GraphのPreGraphの分割によるVelvetの改良
- De Bruijn GraphのPreGraphの分割によるVelvetの改良
- 構造情報に基づくタンパク質間相互作用ネットワーク予測精度の改善
- 結晶スクリーニング結果を活用した機械学習による結晶化条件の予測モデルアレイ
- 機械学習を用いた薬物のクリアランス経路予測
- タンデム質量分析ソフトウェアCoCoozoのマルチコアCPUとGPUを用いた高速化
- SDBP: スピーディー・ダブルブートストラップ法に基づいた系統樹の信頼性評価のためのRパッケージ
- タンパク質ドッキング予測における実空間での効率的な評価スコア計算方法の研究(一般,機械学習によるバイオデータマインニング,一般)
- Suffix arrayを用いた高速な配列相同性検索の改良とエピゲノム解析への対応(一般,機械学習によるバイオデータマインニング,一般)
- ハッシュテーブルの分割によるde novoアセンブリの改良(一般,機械学習によるバイオデータマインニング,一般)
- タンパク質間ドッキング予測における目的関数の機械学習を用いた動的調整(一般,機械学習によるバイオデータマインニング,一般)
- 簡易疎水性相互作用モデルによるタンパク質間ドッキング予測の高精度化(一般,機械学習によるバイオデータマインニング,一般)
- 拡張されたナイーブベイズを用いたメタゲノム配列の系統分類
- GPGPUを用いた高速な配列相同性検索の圧縮アミノ酸によるアルゴリズム改良
- De Bruijn Graphの分割によるVelvetの消費メモリの低減
- 拡張されたナイーブベイズを用いたメタゲノム配列の系統分類
- GPGPUを用いた高速な配列相同性検索の圧縮アミノ酸によるアルゴリズム改良
- De Bruijn Graphの分割によるVelvetの消費メモリの低減
- 顧みられない熱帯病に対するIT創薬の現状 (今田治教授退任記念号・兵藤友博教授退任記念号)
- 大規模GPUクラスタによるタンパク質ドッキング計算システム
- 大規模GPUクラスタによるタンパク質ドッキング計算システム
- Sparse k-mer graphアルゴリズムの評価とVelvetへの実装(機械学習によるバイオデータマインニング,一般)
- ハッシュテーブルの分割による de novo アセンブリの改良
- 簡易疎水性相互作用モデルによるタンパク質間ドッキング予測の高精度化
- タンパク質ドッキング予測における実空間での効率的な評価スコア計算方法の研究