ライフサイエンス分野を対象とした低レベルのテキスト処理(解析)
スポンサーリンク
概要
- 論文の詳細を見る
ライフサイエンス分野テキストに特有な言語現象を調査し、分析結果を足掛かりに、GENIA Corpus 3.02のわかち書き仕様と品詞体系の変更箇所を提案し、統計的自然言語処理の手法を用いて形態素解析システム「cocab」を実現した。予備実験で、今回提案した仕様でタグ付与したコーパスから学習したモデルは、GENIA Corpus 3.02から直接学習したモデルより、誤り率が改善されることを確認した。
- 一般社団法人情報処理学会の論文
- 2004-01-13
著者
-
佐藤 賢二
金沢大学
-
小長谷 明彦
東京工業大学
-
山本 薫
理化学研究所ゲノム総合科学センターゲノム情報科学グループ
-
小長谷 明彦
理化学研究所ゲノム科学総合研究センター
-
小長谷 明彦
理化学研究所ゲノム情報科学研究グループ
-
佐藤 賢二
北陸先端科学技術大学院大学知識科学研究科
関連論文
- 分子生物情報研究会(SIG-MBI)(研究会総覧)
- 生命と情報通信-情報通信技術に生命機能を吹き込む-, 澤井秀文(編著), (株)オーム社, 275p., 3,500円+税, ISBN978-4-274-50250-7
- マルチコアアーキテクチャのための密行列LU分解のプログラミング技術
- JAISTにおける計算科学的アプローチを用いた分子関連研究
- スプライスト・アライソメントに基づいたcDNAライブラリの正確なクラスタリング・アルゴリズム
- ライフサイエンス分野を対象とした低レベルのテキスト処理(解析)
- Conditional Random Fieldsを用いた日本語形態素解析(解析)
- 系列パターンマイニングによる対訳表現抽出
- テキストデータベースからの構文構造のマイニング
- 言語情報を利用したテキストマイニング
- テキストデータベースからの構文構造のマイニング (テーマ:「アクティブマイニング」および一般)
- 統計的係り受け結果を用いた対訳表現抽出
- 対訳表現抽出における翻訳単位の比較
- 対訳表現抽出における翻訳単位の比較
- 素性空間再構成によるWord-Sense Disambiguation
- 素性空間再構成によるWord-Sense Disambiguation
- Support Vector Machineによる英語係り受け解析
- 2000-NL-137-3 統計的な係り受け解析結果を用いた対訳表現抽出について
- 構文情報に基づく情報抽出システム開発のためのツール(ツール,質問応答,要約)
- 並列化に適した遺伝的ローカルサーチによる非線形関数最適化
- 距離に依存せずに多様性を制御するGAによる高次元関数最適化
- 距離に依存せずに多様性を制御するGAによる高次元関数最適化
- EAXとILKの融合による大規模TSPの解法
- ゲノムと論理 : 論理推論はバイオインフォマティクスを超えられるか?(論理と推論技術の展開)
- 機械学習技術を用いたエピジェネティクス関連領域の予測(バイオインフォマティクスと人工知能の新たなインタラクション)
- 7.バイオデータベースの技術的問題点(バイオデータベースの今)
- バイオインフォマティクス(私のブックマーク)
- 生体分子間相互作用と局在に関する空間シミュレーションモデル
- 生体分子間相互作用と局在に関する空間シミュレーションモデル(セッション5)
- 生体分子間相互作用と局在に関する空間シミュレーションモデル(セッション5)
- 文献からの薬物相互作用情報の抽出に向けて(意味表現・データマイニング)
- オントロジーとシミュレーションを用いたハイブリッド型薬物相互作用予測システムの構築について