生物学文献からの専門用語抽出における機械学習モデルの検討
スポンサーリンク
概要
- 論文の詳細を見る
本論文ではSVM(Support Vector Machine)による機械学習モデルを利用した専門用語抽出モデルの構築について議論ずる.対象とする分野は分子生物学でこの分野の文献から専門用語を認識し,あらかじめ用意する意味カテゴリーに分類する.固有抽出表現ではMUC-6に見られるような新聞記事を中心としたタスクが行なわれてきたが,認識すべき用語の困難さが大きく異なることが特徴である.本研究では比較のためにHMM(Hidden Markov Model)を用いた学習モデルを用意し,SVMによる学習モデルとの精度を分子生物学データ,MUC-6データの各々に対して適用しその精度を評価した.実験の結果,両データに対してSVMの抽出精度がHMMの精度を上回る結果を得た.この結果から最適な抽出モデルについて検討をおこなう.
- 2002-07-15
著者
関連論文
- 類似度の高いサブクラスタに基づく名詞クラスタリング(「ユニバーサルコミュニケーションを実現するための言語処理技術」シンポジウム)
- 動詞項構造シソーラスに基づく動詞語義ならびに意味役割付与データの構築
- 語彙概念構造を利用した複合名詞内の係り関係の解析(システムLSIの設計技術と設計自動化)
- 文法的制約を用いた複合語解析モデルの作成
- 含意関係計算のための事態オントロジーの開発に向けて(言語理解とオントロジーシンポジウム)
- 語彙概念構造に基づく日本語動詞の統語・意味特性の記述 (まえがき)
- 分類の根拠を明示した動詞語彙概念構造辞書の構築(辞書と辞典)
- SRLを利用した規則ベースの感染症用語抽出
- 類似した動作や状況を検索するための意味役割及び動詞語義付与システムの構築(第1回集合知シンポジウム〜言語処理が紡ぎ出す未来〜)
- グラフに基づくクラスタリングによる動詞類義語の獲得(自然言語の論理と感情)
- グラフに基づくクラスタリングによる動詞類義語の獲得(自然言語の論理と感情)
- 貴重書ディジタルアーカイブにおけるテキスト可読性と異種メディア間共参照アノテーション
- ニュース記事マッチングからの二言語コーパス構築に対する局所的適合フィードバック法の応用
- 生物学文献からの専門用語抽出における機械学習モデルの検討
- 生物学文献からの専門用語抽出における機械学習モデルの検討
- メタファ分析に基づく置換可能な動詞カテゴリの作成(述語/動詞の言い換えとクラスタリング・分析)
- 多義性を考慮した同時共起クラスタリングによる動詞の類語抽出(「ユニバーサルコミュニケーションを実現するための言語処理技術」シンポジウム)
- 名詞の概念体系を利用した規則に基づく意味役割付与モデルの構築(語彙意味論・知識表現)
- 名詞の概念体系を利用した規則に基づく意味役割付与モデルの構築(語彙意味論・知識表現)
- 語彙の制約を考慮した複合語解析モデルの構築
- 語彙の制約を考慮した複合語解析モデルの構築
- 言語情報処理における辞書と語彙概念構造 (まえがき)
- 候補の接続関係を考慮した複合語用語抽出
- 形態素出現パタンに基づく文書集合類似性評価(スパム検出・類似性評価)
- 動詞の語義と意味役割を付与したタグ付コーパスの作成
- 用語クラスタリングに基づく部分研究領域推定と用語分類(語彙・意味)
- 用語クラスタリングに基づく部分研究領域推定と用語分類(語彙・意味)
- 日本語複合語用語の入れ子関係に基づく階層的体系化
- 日本語複合語用語の入れ子関係に基づく階層的体系化(語彙1)
- 日本語専門分野テキストコーパスからの複合語用語の抽出(抽出)
- 文法パターンに基づく用語抽出モデルの構築(言語理解とコミュニケーション一般)
- 語彙概念構造を利用した助詞「に」に関する複合名詞の分析
- 語彙概念構造を利用した助詞「に」に関する複合名詞の分析
- 専門分野における複合名詞解析のための名詞文法属性の分類について
- 対称モデルに基づく共参照関係アノテーションスキーマ
- 複合名詞に着目したWeb検索結果のクラスタリング(文書分類・評判分析)
- 複合名詞に着目したWeb検索結果のクラスタリング(文書分類・評判分析)
- 少数正解事例に基づく動詞語義及び名詞意味役割付与システム(辞書ベース,自然言語処理)
- サ変名詞を含む複合名詞の語義解析システム及び名詞辞書の構築(辞書ベース,自然言語処理)
- 網羅的な検出を重視した異形パターンに基づく日本語慣用句同定システム(辞書ベース,自然言語処理)
- 少数正解事例に基づく動詞語義及び名詞意味役割付与システム(辞書ベース,自然言語処理)
- サ変名詞を含む複合名詞の語義解析システム及び名詞辞書の構築(辞書ベース,自然言語処理)
- 網羅的な検出を重視した異形パターンに基づく日本語慣用句同定システム(辞書ベース,自然言語処理)
- 動詞とその結果状態を関係付ける結果状態辞書の構築(辞書ベース,自然言語処理)
- 統計的学習モデルとルールベースモデルに基づく用語抽出システムの比較(基礎技術,自然言語処理)
- 統計的学習モデルとルールベースモデルに基づく用語抽出システムの比較(基礎技術,自然言語処理)
- 動詞とその結果状態を関係付ける結果状態辞書の構築(辞書ベース,自然言語処理)
- 述語の分析に基づく文書解析の考察
- グラフ構造に基づく同時クラスタリングを利用した動詞の属性クラスの抽出(述語/動詞の言い換えとクラスタリング・分析)