テンプレートマッチングと照応解析を利用した文献からの蛋白質活性部位情報抽出方式(バイオインフォマティクス)(<特集>情報システム論文)
スポンサーリンク
概要
- 論文の詳細を見る
蛋白質の機能は活性部位と呼ばれる局所的な部位によって決定されることから, 詳細な活性部位情報をデータベース化することが望まれている.活性部位情報は蛋白質の構造解析実験に関する論文に記述されているが, この数は数万編に上るため, 人手で抽出するのは時間的・労力的に困難である.そこで本研究では, 文献から活性部位情報を自動抽出する方式を提案する.文献には複文を用いた表現が多いため, 単純な文字列照合によるテンプレートマッチングは難しい.したがって, 入力文の構文解析を行うことで複文と単文用のテンプレートとの照合を可能にする.テンプレートマッチングによる情報抽出の結果には照応詞が含まれる.蛋白質に関する文献では照応詞に数量表現が多用されることに注目し, 照応詞-先行詞間の数量一致性に基づく照応解析手法を提案する.提案手法を10編の文献に適用して評価を行った結果, 照応解析と情報抽出のF値はそれぞれ0.81, 0.70となった.
- 一般社団法人情報処理学会の論文
- 2005-03-15
著者
関連論文
- 分子表面データ間の距離を利用した効率的類似蛋白質検索方式
- 属性付き法線ベクトルを用いた蛋白質分子表面比較方式
- ゲノムネット検索を利用した文献内の固有表現同定方式
- 蛋白質立体構造データを利用した文献からの蛋白質相互作用記述文抽出方式
- テンプレートマッチングと照応解析を利用した文献からの蛋白質活性部位情報抽出方式(バイオインフォマティクス)(情報システム論文)
- 蛋白質立体構造データに基づく原子間距離情報を利用した文献からの蛋白質相互作用情報抽出方式(情報抽出)