ゲノムネット検索を利用した文献内の固有表現同定方式
スポンサーリンク
概要
- 論文の詳細を見る
Information extraction (IE) is essential owing to increase of protein related literature contains active site and interaction information. It is important to identify correctly named entities for the accurate information extraction. Named entities in molecular biology fields is described variously and cannot be identified easily by terminology dictionary. This paper proposes a new method for automatic identification of named entities in literatures using GenomeNet. GenomeNet has text search system for a lot of protein related databases which are updated every day. Our method utilizes the search result of GenomeNet as knowledge base. The search result contains the clues for identifying named entities. Focusing on the clues in the search results, three parameters are defined. And we can identify the named entities to figure out if the three parameters meets the identification condition. We applied proposed method for some protein related literatures to compare with other method. The evaluated value is improved substantially and efffectness of proposed method is clear.
- 社団法人 電気学会の論文
- 2005-05-01
著者
関連論文
- 分子表面データ間の距離を利用した効率的類似蛋白質検索方式
- 属性付き法線ベクトルを用いた蛋白質分子表面比較方式
- ゲノムネット検索を利用した文献内の固有表現同定方式
- 蛋白質立体構造データを利用した文献からの蛋白質相互作用記述文抽出方式
- テンプレートマッチングと照応解析を利用した文献からの蛋白質活性部位情報抽出方式(バイオインフォマティクス)(情報システム論文)
- 蛋白質立体構造データに基づく原子間距離情報を利用した文献からの蛋白質相互作用情報抽出方式(情報抽出)