DNAマイクロアレイ技術および関連する数学的課題(数学者のための分子生物学入門,研究会報告)
スポンサーリンク
概要
- 論文の詳細を見る
DNAには多くの遺伝子が含まれているが、各遺伝子にはタンパク質に関する情報が記述され、必要に応じて遺伝子からタンパク質が合成される。生物の理解のためには、遺伝子がどのように制御されるか(すなわち、各タンパク質が、いつ、なぜ、どのように合成されるか)、各タンパク質はどのような機能を持つか、タンパク質どうし、もしくは、タンパク質が周囲の物質や刺激とどう相互作用するか、を明らかにすることが必要である。近年、開発されたDNAマイクロアレイやDNAチップといった技術を用いることにより、様々な条件下において、各生物のほぼすべての遺伝子の発現(タンパク質の生成)量を間接的に同時に観測することができるようになりつつあるため、その情報解析手法の開発も重要な課題となっている。1. DNAマイクロアレイ技術 DNAマイクロアレイは、あらかじめ各遺伝子配列より作成した一本鎖のプローブDNAをガラス基板などの上に配置したものである。一方、細胞よりメッセンジャーRNAを通じて抽出した一本鎖の相補DNA(cDNA)を蛍光物質などでラベルしておき、これらのcDNAとマイクロアレイ上のプローブDNAをハイブリダイゼーションと呼ばれる技術を用いて結合させることにより、メッセンジャーRNAの量を間接的に測定する。2.データの正規化 DNAマイクロアレイによる実験データは、画像データとして得られるため、まず、画像処理を行い各遺伝子に対応する領域の強度を求める。しかしながら、遺伝子により強度やその分布に大きな違いがあるため、データの正規化が必要となる。そのために、リファレンスとなる状態のデータと観測したデータを比較し、さらに統計解析などを行うことにより正規化するという手法が広く利用されている。3.教師なし学習 通常、数十から数百程度の異なる環境下で数千から数万個の遺伝子の発現量を観測する。これらの発現データの解析法としてクラスタリングと呼ばれる教師なし学習法(分類法)が広く利用されているが、その利用法は大きく二種類に分けられる。一つは遺伝子発現量の違いによる細胞の分類であり、もう一つは遺伝子発現量の変化の比較による遺伝子の分類である。前者は数万次元空間における数百点の分類に相当し、後者は数百次元空間における数万点の分類に相当する。クラスタリング手法は、階層的クラスタリング法と分割に基づくクラスタリング法に大きく分類されるが、どのようなクラスタリングを用いれば良いかはよくわかっていない。4.教師あり学習 遺伝子発現データは、がん細胞の分類にも利用できるが、その際には学習データの一部としてあらかじめ分類結果が与えられることが多い。このような場合の学習は教師あり学習と呼ばれる。教師あり学習の場合には、学習データに対するエラーが最小となる仮説を計算するといった戦略がよく用いられるが、発現データの場合には、数千から数万次元のデータを扱うため、過学習を起こし易い。高次元における学習は重要な数学的研究課題である。5.システム生物学 遺伝子やタンパク質などの制御関係やパラメータを明らかにし、生物の数理モデルを作成し、より正確なシミュレーションを行うことは今後の重要な研究課題であり、システム生物学の名のもとに研究が進展しつつある。制御関係やパラメータの推定のためにベイジアンネットワークなどの確率モデルや微分方程式に基づく方法が研究されている。しかしながら、より多様なデータに対する数理モデルや推定方式など、研究すべき課題は多い。
- 2003-10-20
著者
関連論文
- 代謝ネットワークの最小反応カットを求めるアルゴリズム
- 整数計画法を用いたブーリアンネットワークの解析・制御手法(システムバイオロジー,システムバイオロジー,一般)
- 高さの制限された無順序木の編集距離問題に対する近似アルゴリズム
- タンパク質ドメインネットワークに対する二部グラフのモデル
- タンパク質間相互作用ネットワークにおける相互作用ドメイン対の確率的選択に基づくべき乗分布のモデル化
- 最適degenerate pattern探索アルゴリズムと転写因子結合部位同定問題への適用
- 最適 degenerate pattern 探索アルゴリズムと転写因子結合部位同定問題への適用
- 高さの制限された2個の無順序木に対する最大共通部分木の近似アルゴリズムの改良
- 2J-3 確率モデルに基づく木の類似度のパラメータ学習について(情報爆発時代におけるマルチメディアデータと交通情報システム,一般セッション,「情報爆発」時代に向けた新しいIT基盤技術)
- パス頻度ベクトルからのグラフ推定問題の困難性について
- 類似度の高い無順序木の比較に対する高速アルゴリズム
- ブール関数推定のための貪欲アルゴリズムの性能解析
- タンパク質ベータシート予測 : 動的計画法と形式文法によるアプローチ(一般セッション3)
- 形式文法に基づくRNA2次構造予測(若手研究者のための講演会)
- 期待精度最大化に基づくRNAシュードノット予測
- 構造トポロジーと複雑ネットワーク特徴量からのタンパク質フォールディング速度予測
- 無順序木の編集距離計算のための厳密アルゴリズム
- 整数計画法によるシュードノットつきRNA2次構造予測
- 整数計画法によるシュードノットつきRNA2次構造予測
- 相互作用RNA2次構造予測 : 形式文法によるアプローチ
- 効率的クリークアルゴリズムに基づく電気泳動画像マッチング、タンパク質構造マッチング、および、タンパク質側鎖パッキング
- 確率ブーリアンネットワークのアトラクター検出とブーリアンネットワークとのアトラクターの関係
- タンパク質間相互作用ネットワークにおける相互作用ドメイン対の確率的選択に基づくべき乗分布のモデル化
- 入次数に制約のあるブーリアンネットワークに対する先行状態検出問題および制御問題について
- 細胞アレイ解析のための線形計画法を用いたレポーター遺伝子の最適配置
- タンパク質間相互作用強度予測の高速化と困難性(ニューラルネットワーク及び生物工学)
- 制約付きプロファイルアライメント(文字列アルゴリズム)
- タンパク質間の相互作用強度予測(バイオインフォマティック)
- タンパク質間の相互作用強度予測
- パス頻度ベクトルからのグラフ推定問題の困難性について
- 生育温度による代謝ネットワーク構造の差異
- 21aTP-11 原核生物における代謝ネットワークの構造と成育温度の関係(生物・生態系(社会・言語・ゲーム等含む)1,領域11,統計力学,物性基礎論,応用数学,力学,流体物理)
- 半空間の和集合の例からの推定
- 位置依存スコア行列の例からの学習の計算複雑度について
- 2K-1 高さ制約付き無順序木の高速類似検索アルゴリズムについて(情報爆発時代におけるアルゴリズム高率化,一般セッション,「情報爆発」時代に向けた新IT基盤技術,情報処理学会創立50周年記念(第72回)全国大会)
- 生物配列の局所マルチプルアラインメントの計算困難性
- 計算生物学におけるカーネル法(数学者のための分子生物学入門,研究会報告)
- 遺伝子発現量ダイナミックスにおける自己相似性について(バイオインフォマティックス(2))
- バイオインフォマティクスと人工知能の相互作用(バイオインフォマティクスと人工知能の新たなインタラクション)
- 確率的数理モデルを用いたアポトーシス制御機構の解明
- DNAマイクロアレイ技術および関連する数学的課題(数学者のための分子生物学入門,研究会報告)
- AND/OR節点で構成されるブーリアンネットワークの定常状態を検出するアルゴリズムの改良
- AND/OR節点で構成されるブーリアンネットワークの定常状態を検出するO(1.787^n)時間アルゴリズム
- アラインメントとアミノ酸構成比に基づいたサポートベクターマシンによるタンパク質の細胞内局在予測
- 生体内ネットワーク構造の数理モデルと情報解析
- 機械学習を用いたDNA修復タンパク質の識別と分類
- バイオインフォマティクスにおける基本アルゴリズム(数学者のための分子生物学入門,研究会報告)
- Detection and Enumeration of Steady States in Biological Information Networks (Acceleration and Visualization of Computation for Enumeration Problems)
- 局所アラインメントカーネルを用いたアミノ酸置換行列の最適化(セッション4)
- 双対分解によるRNA構造アラインメント
- BI-7-5 遺伝子ネットワークと代謝ネットワークの離散数理モデルとその制御(BI-7.情報ネットワーク科学が目指すもの,依頼シンポジウム,ソサイエティ企画)
- 無順序木の編集距離の指数時間厳密アルゴリズム
- 文字列の距離空間上の最大マージン識別器とそのタンパク質科学への応用
- 文字列の距離空間上の最大マージン識別器とそのタンパク質科学への応用
- 無順序木の編集距離の指数時間厳密アルゴリズム