ユーザフィードバックに基づく訓練データ拡張を伴う蛋白質機能情報文抽出に関する研究
スポンサーリンク
概要
- 論文の詳細を見る
蛋白質の機能は,蛋白質の構造解析実験の結果得られ,論文などの文献中に記述され蓄積されている.この機能情報は,新薬の開発や生命現象の解明に必要な情報であるためデータベース化が求められている.そこで,蓄積された大量の文献から機能情報を抽出する手法を提案する.本論文では,文献からの機能情報の抽出を,文献中の各文について機能情報を含むか否かの分類問題として扱う.このような分類問題に対する典型的な機械学習を用いた手法では,あらかじめ与えられた訓練データを用いて分類器を学習するが,十分な訓練データが与えられない場合,高い精度は期待できない.そこで,訓練データを拡張することによって分類精度の向上を図る.訓練データを拡張するため,機能情報文であるかどうかが判明していない文から構成される参照データを用い,ユーザからのフィードバックを基に距離学習を行うことで参照データから精度向上に効果的な文を選択し,訓練データに追加する.評価実験では,少ないフィードバックで精度の向上が見られ,提案手法によりユーザへの負担を軽減しつつ精度向上が実現できることを確認した.
- 2010-12-09
著者
-
大川 剛直
神戸大学大学院工学研究科情報知能学専攻
-
大川 剛直
神戸大学大学院 工学研究科
-
宮西 一徳
神戸大学大学院自然科学研究科
-
尾崎 知伸
大阪大学サイバーメディアセンター
-
大川 剛直
神戸大学大学院システム情報学研究科
関連論文
- 潜在トピックを用いたブログ空間からの情報伝搬ネットワーク抽出(情報検索 Web情報システム,データ工学論文)
- 多重トピックを用いたブログ空間の情報伝搬解析(ブログ・情報検索)
- 潜在トピックを用いたブログ空間からの情報伝搬ネットワーク抽出
- 多重解像度解析を応用したフレーム合成による遠方車両認識手法の提案(テーマセッション1,移動カメラ画像処理におけるパターン認識とメディア理解)
- 動画像のフレーム合成による低解像度車両認識技術に関する研究
- 蛋白質-化合物複合体立体構造データに基づく類似相互作用蛋白質の検索方式(バイオインフォマティックス, 第11回MPSシンポジウム: 複雑系の科学とその応用)
- ユーザフィードバックに基づく訓練データ拡張を伴う蛋白質機能情報文抽出に関する研究
- ユーザフィードバックに基づく訓練データ拡張を伴う蛋白質機能情報文抽出に関する研究
- ビル空調の制御装置の診断システム
- 内部および外部重みを考慮した頻出部分グラフマイニング
- 外部・内部重み付きグラフマイニングにおける評価尺度の比較 (特集 「知識発見の生命科学への応用」および一般)
- 被覆集合に着目したグラフデータベースからの分割パターンの発見 (特集 「知識発見の生命科学への応用」および一般)
- 概念的類似度の更新に基づく観点を考慮した蛋白質構造解析文献の検索支援 (特集 「知識発見の生命科学への応用」および一般)
- 蛋白質-蛋白質相互作用ネットワークにおける周辺クラスタとの立体構造類似度を考慮した相互作用部位予測 (特集 「知識発見の生命科学への応用」および一般)
- コーパスからの文選択による事例集合拡張に基づく蛋白質名判定
- コーパスからの文選択による事例集合拡張に基づく蛋白質名判定
- 複合構造グラフからの頻出強相関パターン発見
- 距離の再定義を伴う事例選択を用いたタンパク質機能情報文抽出方式
- 区間イベント集合に関する系列パターンマイニングの拡張 (特集 「大規模データからの機械学習と自然言語処理への応用」および一般)
- 定量的アイテム集合発見による属性付き単一グラフマイニング (特集 「大規模データからの機械学習と自然言語処理への応用」および一般)
- 拡張出現マッチングを用いた制約付きノイズ許容極小順序木パターンの発見
- 関連データに基づく事例集合拡張による文献からの蛋白質名判定
- 部分代謝構造を用いた代謝パスウェイの比較解析
- 部分代謝構造を用いた代謝パスウェイの比較解析
- 関連データに基づく事例集合拡張による文献からの蛋白質名判定
- RG-001 概念階層を用いたタンパク質構造・機能情報に基づく関連文献検索支援システムの構築(生体情報科学,査読付き論文)
- 構造データ集合からなるグラフデータベースからの頻出パターン発見
- タンパク質機能情報文抽出規則の繰り返し学習における効果的学習順序の探索
- ソースコード検索システムの試作とフリーソフトウェアへの適用実験
- 時系列画像のエッジを利用した剛体仮定によるマッチング法の提案
- 仮想濃度勾配を用いた輪郭線の動き検出(一般セッション(2), ユビキタスメディアの将来展望)
- 仮想濃度勾配を用いた輪郭線の動き検出(一般セッション(2), ユビキタスメディアの将来展望)
- 根付き木パタン発見手法の拡張による高速飽和・極大自由木マイニング (テーマ:特集「スキルサイエンス」および一般)
- 局所類似構造を用いた蛋白質機能部位発見に関する研究
- 座標基準点探索による蛋白質相互作用プロファイルの抽出(DNA・タンパク質構造)
- 蛋白質-化合物複合体の相互作用部位プロファイルを用いた類似相互作用蛋白質検索方式(Sequence & structure analysis)
- 蛋白質分子表面モチーフの抽出とその並列化実装(バイオインフォマティックス, 第11回MPSシンポジウム: 複雑系の科学とその応用)
- 蛋白質分子表面モチーフの抽出とその並列化実装
- 制限付き最右拡張を用いた効率的な飽和順序木の発見
- スネークス手法を使った先行車両認識手法(一般セッション(1), ユビキタスメディアの将来展望)
- スネークス手法を使った先行車両認識手法(一般セッション(1), ユビキタスメディアの将来展望)
- 反応構造プロファイルによる異種生物種間の代謝パスウェイ比較解析
- 順序木データベースからの相互非類似パターン集合の発見 (「スキルサイエンス」「論理プログラミング」及び一般)
- グラフデータベースからの上位K強相関部分グラフ対の発見 (「スキルサイエンス」「論理プログラミング」及び一般)
- 多次元構造データからの分類知識の獲得
- D-12-52 射影変換による画像中の障害物検出(D-12.パターン認識・メディア理解,一般講演)
- 蛋白質機能情報抽出支援システムPROFESSにおけるSVMを利用した機能情報文特定方式(Text mining)
- タンパク質の立体構造情報と類似部分グラフマイニングを利用した結合部位の自動抽出に関する研究(一般講演(バイオ情報学),機械学習によるバイオデータマインニング,一般)
- 利用者の意図を考慮した概念的観点に基づく蛋白質構造解析文献検索手法(一般講演(バイオ情報学),機械学習によるバイオデータマインニング,一般)
- ICTを活用した教育・学習支援のトレンドを企画して(ICTを活用した教育・学習支援のトレンド)
- 文の接続関係を考慮した蛋白質構造解析文献からの相互作用記述文抽出方法(一般講演(バイオ情報学),機械学習によるバイオデータマインニング,一般)
- 多次元構造データからの決定木の構築 (テーマ:「データマイニングと統計数理」および一般)
- 3次元画像特徴量を用いた蛋白質分子表面比較
- 複数の分類器に基づく半教師あり学習を用いた文献からの蛋白質間相互作用抽出
- 複数の分類器に基づく半教師あり学習を用いた文献からの蛋白質間相互作用抽出(合同企画セッション:バイオデータマイニング,機械学習によるバイオデータマインニング,一般)
- 3次元画像特徴量を用いた蛋白質分子表面比較(合同企画セッション:バイオデータマイニング,機械学習によるバイオデータマインニング,一般)