蛋白質機能情報抽出支援システムPROFESSにおけるSVMを利用した機能情報文特定方式(Text mining)
スポンサーリンク
概要
- 論文の詳細を見る
我々は、蛋白質構造解析に関する文献から、蛋白質機能情報の抽出を支援するシステムPROFESS (PROtein Functional site information Extraction Support System)を開発している。PROFESSは、機能情報記述文の特定機能、機能情報記述文からの情報抽出機能、抽出結果の手動編集機能を備え、機能情報のデータベース化を総合的に支援する。本稿では、SVMを利用した機能情報記述文の特定手法について述べる。PROFESSが対象とする文献には、必ず対応する立体構造データが存在する。このことを利用し、提案手法では、機能情報関連キーワードや記述パターンといった「文に関する特徴」に加え、文中に記述されている残基と相互作用対象の3次元空間上での距離といった「構造に関する特徴」をもとに、各文を特徴ベクトルで表現し、SVMによる学習を実現する。提案手法を蛋白質の構造解析関連の7編の文献に適用した結果、機能情報記述文の特定に関する平均再現率は0.72、平均F値は0.70となった。
- 一般社団法人情報処理学会の論文
- 2005-12-22
著者
関連論文
- 潜在トピックを用いたブログ空間からの情報伝搬ネットワーク抽出(情報検索 Web情報システム,データ工学論文)
- 多重解像度解析を応用したフレーム合成による遠方車両認識手法の提案(テーマセッション1,移動カメラ画像処理におけるパターン認識とメディア理解)
- 動画像のフレーム合成による低解像度車両認識技術に関する研究
- 蛋白質-化合物複合体立体構造データに基づく類似相互作用蛋白質の検索方式(バイオインフォマティックス, 第11回MPSシンポジウム: 複雑系の科学とその応用)
- ユーザフィードバックに基づく訓練データ拡張を伴う蛋白質機能情報文抽出に関する研究
- ユーザフィードバックに基づく訓練データ拡張を伴う蛋白質機能情報文抽出に関する研究
- ビル空調の制御装置の診断システム
- 内部および外部重みを考慮した頻出部分グラフマイニング
- 外部・内部重み付きグラフマイニングにおける評価尺度の比較 (特集 「知識発見の生命科学への応用」および一般)
- 被覆集合に着目したグラフデータベースからの分割パターンの発見 (特集 「知識発見の生命科学への応用」および一般)
- 概念的類似度の更新に基づく観点を考慮した蛋白質構造解析文献の検索支援 (特集 「知識発見の生命科学への応用」および一般)
- 蛋白質-蛋白質相互作用ネットワークにおける周辺クラスタとの立体構造類似度を考慮した相互作用部位予測 (特集 「知識発見の生命科学への応用」および一般)
- コーパスからの文選択による事例集合拡張に基づく蛋白質名判定
- コーパスからの文選択による事例集合拡張に基づく蛋白質名判定
- 複合構造グラフからの頻出強相関パターン発見
- 距離の再定義を伴う事例選択を用いたタンパク質機能情報文抽出方式
- 区間イベント集合に関する系列パターンマイニングの拡張 (特集 「大規模データからの機械学習と自然言語処理への応用」および一般)
- 定量的アイテム集合発見による属性付き単一グラフマイニング (特集 「大規模データからの機械学習と自然言語処理への応用」および一般)
- 拡張出現マッチングを用いた制約付きノイズ許容極小順序木パターンの発見
- 関連データに基づく事例集合拡張による文献からの蛋白質名判定
- 部分代謝構造を用いた代謝パスウェイの比較解析
- 部分代謝構造を用いた代謝パスウェイの比較解析
- 関連データに基づく事例集合拡張による文献からの蛋白質名判定
- RG-001 概念階層を用いたタンパク質構造・機能情報に基づく関連文献検索支援システムの構築(生体情報科学,査読付き論文)
- 構造データ集合からなるグラフデータベースからの頻出パターン発見
- タンパク質機能情報文抽出規則の繰り返し学習における効果的学習順序の探索
- 時系列画像のエッジを利用した剛体仮定によるマッチング法の提案
- 仮想濃度勾配を用いた輪郭線の動き検出(一般セッション(2), ユビキタスメディアの将来展望)
- 仮想濃度勾配を用いた輪郭線の動き検出(一般セッション(2), ユビキタスメディアの将来展望)
- 根付き木パタン発見手法の拡張による高速飽和・極大自由木マイニング (テーマ:特集「スキルサイエンス」および一般)
- 局所類似構造を用いた蛋白質機能部位発見に関する研究
- 座標基準点探索による蛋白質相互作用プロファイルの抽出(DNA・タンパク質構造)
- 蛋白質-化合物複合体の相互作用部位プロファイルを用いた類似相互作用蛋白質検索方式(Sequence & structure analysis)
- 蛋白質分子表面モチーフの抽出とその並列化実装(バイオインフォマティックス, 第11回MPSシンポジウム: 複雑系の科学とその応用)
- 蛋白質分子表面モチーフの抽出とその並列化実装
- 制限付き最右拡張を用いた効率的な飽和順序木の発見
- スネークス手法を使った先行車両認識手法(一般セッション(1), ユビキタスメディアの将来展望)
- スネークス手法を使った先行車両認識手法(一般セッション(1), ユビキタスメディアの将来展望)
- 反応構造プロファイルによる異種生物種間の代謝パスウェイ比較解析
- 順序木データベースからの相互非類似パターン集合の発見 (「スキルサイエンス」「論理プログラミング」及び一般)
- グラフデータベースからの上位K強相関部分グラフ対の発見 (「スキルサイエンス」「論理プログラミング」及び一般)
- 多次元構造データからの分類知識の獲得
- D-12-52 射影変換による画像中の障害物検出(D-12.パターン認識・メディア理解,一般講演)
- 蛋白質立体構造データに基づく原子間距離情報を利用した文献からの蛋白質相互作用情報抽出方式(情報抽出)
- 蛋白質機能情報抽出支援システムPROFESSにおけるSVMを利用した機能情報文特定方式(Text mining)
- タンパク質の立体構造情報と類似部分グラフマイニングを利用した結合部位の自動抽出に関する研究(一般講演(バイオ情報学),機械学習によるバイオデータマインニング,一般)
- 利用者の意図を考慮した概念的観点に基づく蛋白質構造解析文献検索手法(一般講演(バイオ情報学),機械学習によるバイオデータマインニング,一般)
- 文の接続関係を考慮した蛋白質構造解析文献からの相互作用記述文抽出方法(一般講演(バイオ情報学),機械学習によるバイオデータマインニング,一般)
- 多次元構造データからの決定木の構築 (テーマ:「データマイニングと統計数理」および一般)
- 3次元画像特徴量を用いた蛋白質分子表面比較
- 複数の分類器に基づく半教師あり学習を用いた文献からの蛋白質間相互作用抽出
- 複数の分類器に基づく半教師あり学習を用いた文献からの蛋白質間相互作用抽出(合同企画セッション:バイオデータマイニング,機械学習によるバイオデータマインニング,一般)
- 3次元画像特徴量を用いた蛋白質分子表面比較(合同企画セッション:バイオデータマイニング,機械学習によるバイオデータマインニング,一般)