複数尺度を用いた参考文献の同定(テキストマイニング技術)
スポンサーリンク
概要
- 論文の詳細を見る
ある文献が他のどの文献を参照しているか、という文献の参照情報は、その文献の参考文献一覧の各一文(参考文献文)が指し示している文献を、文献データベース(著者、題目、掲載誌等からなる文献を表す文献データ集合)中から同定することで獲得できる。この同定を、参考文献文と文献データの単なる文字列の完全一致判定で行なうことはできない。参考文献文に表記の多様性や誤りが存在するためである。本稿では参照情報の自動獲得手法を提案する。始めに、単一のベクトル空間とその上での類似度を用いて粗く候補を絞る。次に、参考文献と文候補が同一の文献であるかを多数の尺度に基づく類似度を特徴量として判定する。複数の尺度それぞれの重みを人手でつけることは現実的ではないため本稿ではサポートベクターマシーンを用い、各尺度の最適な重みを自動で算出した。結果F値0.992が得られた。
- 一般社団法人情報処理学会の論文
- 2003-05-22
著者
-
新保 仁
奈良先端科学技術大学院大学
-
新保 仁
茨城大学工学部
-
伊藤 敬彦
奈良先端科学技術大学院大学 情報科学研究科
-
伊藤 敬彦
奈良先端科学技術大学院大学情報科学研究科
-
堀部 史郎
奈良先端科学技術大学院大学情報科学研究科
-
松本 裕治
(現)リコー(株)
関連論文
- Espresso 型ブートストラッピング法における意味ドリフトのグラフ理論に基づく分析 : 語義曖昧性解消における評価
- バイパス付き編集グラフを用いた日本語並列構造解析(学習・系列解析・構文解析)
- グラフを用いたバイオ医療専門用語の類義語獲得(語彙・知識獲得)
- Prolog推論網における知識空間構築の一提案
- ネット上で多重バックトラックが可能なエージェント指向推論について
- WWW上のVirtual Corporation おける Mobile Agent利用の一考察
- WWW上におけるVirtual Corporationの構成に関する一考察
- グラフを用いたバイオ医療専門用語の類義語獲得 (情報学基礎・自然言語処理)
- GENIAコーパスからのネスト並列句同定(解析・抽出)
- アラインメントと機械学習を応用した並列句解析 : 医学生物学論文からの情報抽出に向けて
- MEDLINE概要文の役割分類に対する信頼度の異なるデータからの学習の適用(情報抽出・検索)
- 係り受け木を利用した単語類似度計算方法とそのシソーラス拡張への応用
- ハブを作らないグラフ構築法を用いた半教師あり語義曖昧性解消
- 半教師あり語義曖昧性解消のためのグラフスパース化
- 半教師あり語義曖昧性解消のためのグラフスパース化
- 半教師あり語義曖昧性解消のためのグラフスパース化
- 6. 自然言語処理におけるマイニング技術の応用(最新!データマイニング手法)
- グラフを用いたバイオ医療専門用語の類義語獲得(語彙・知識獲得)
- 学習に基く専門用語分類 (人工知能基礎論研究会(第46回) 知識ベースシステム研究会(第54回) 合同研究会 テーマ:「アクティブマイニング」および一般)
- 学習に基く専門用語分類 (人工知能基礎論研究会(第46回) 知識ベースシステム研究会(第54回) 合同研究会 テーマ:「アクティブマイニング」および一般)
- カーネル法による計量書誌尺度の統一的解釈
- カーネル法による計量書誌尺度の統一的解釈(一般 : データマイニングI)
- カーネル法による計量書誌尺度の統一的解釈(一般(データマイニングI))(「社会システムにおける知能」及び一般)
- カーネル関数を利用した共引用分析の拡張(9月15日)(「アクティブマイニング」及び一般)
- カーネル関数を利用した共引用分析の拡張(「アクティブマイニング」及び一般)
- 系列パターンを素性とした論文概要文の自動分類 (知識ベースシステム研究会(第60回) 人工知能基礎論研究会(第52回) 小特集:「データマイニング」および一般) -- (文部科学省科学研究費特定領域研究 情報洪水時代におけるアクティブマイニングの実現)
- コーパスを用いた言語習得度の推定(語学学習支援・自動校正)
- コミュニティを考慮したカーネル引用解析(データ工学研究専門委員会推薦論文,情報検索,データ工学論文)
- カーネルリンク解析におけるパラメタ依存性と近似計算について
- 利用者からの要求を考慮したテキストデータからの知識抽出(アクティブマイニング)
- MEDLINEからの肝炎に関する知識抽出の試み (特集 「医療及び化学情報マイニング」および一般)
- 分の役割を考慮したMEDLINE文書検索システム(9月14日)(「アクティブマイニング」及び一般)
- 文書の混合・整理による発想支援へのアプローチ
- 文の役割を考慮したMEDLINE文書検索システム(「アクティブマイニング」及び一般)
- 系列パターンを素性とした論文概要文の自動分類
- 系列パターンを素性とした論文概要文の自動分類( 「アクティブマイニング」及び一般 : 文部科学省科学研究費特定領域研究「情報洪水時代におけるアクティブマイニングの実現」公開シンポジウム)
- 系列パターンを素性とした論文概要文の自動分類 (知識ベースシステム研究会(第60回) 人工知能基礎論研究会(第52回) 小特集:「データマイニング」および一般) -- (文部科学省科学研究費特定領域研究 情報洪水時代におけるアクティブマイニングの実現)
- A MEDLINE document search system using section information (小特集 「アクティブマイニング」および一般)
- 複数尺度を用いた参考文献の同定(テキストマイニング技術)
- ベクトル空間モデルを用いた参考文献の同定
- 文脈情報を用いた医学用語分類
- Context-Based Classification of Medical Terms (テーマ:「アクティブマイニング」および一般)
- Computing Citation Relatedness Using Kernels(preliminary report) (小特集 「アクティブマイニング」および一般)
- 「ハブの出現しやすさ」から見たラプラシアンベースカーネル(ポスターセッション,第14回情報論的学習理論ワークショップ)
- k近傍法でハブを軽減する類似度尺度
- k近傍法でハブを軽減する類似度尺度
- 「ハブの出現しやすさ」から見たラプラシアンベースカーネル
- 文法的・意味的共起を利用した単語類似度の計算