共著関係に基づくグラフを用いた書誌情報における著者同定手法の提案と評価(データマイニング・学習, 夏のデータベースワークショップDBWS2005)
スポンサーリンク
概要
- 論文の詳細を見る
学術文献データベースの著者名検索においてイニシャル等を使用するため同表記の別人を区別出来ないという問題がある.この問題に対しては従来のテキスト情報のみを用いる方法では十分な結果が出ていない.そこで我々は論文の共著関係に基づく情報を用いる手法を提案する.まず, 論文における著者名をノードとして共著関係があるノードどうしにエッジを張ることによりできる共著グラフを生成する.グラフ理論においてあるノードを取り除くことによってグラフの連結成分が増える時, このノードを切断点と呼ぶ.共著グラフにおいて切断点は複数の著者に対応する可能性が高いと考えられる.そのため, 切断点を取り除いて得たそれぞれの連結成分中にあるノードを基に論文を分類することで, 異なる著者ごとに論文を分類することが出来ると考えられる.本稿ではまた, 提案手法を実際の学術文献データベースに適用してその有効性を評価した結果を報告する.
- 2005-07-14
著者
-
安達 淳
国立情報学研究所
-
高須 淳宏
National Institute of Informatics
-
安達 淳
National Institute of Informatics
-
正田 備也
国立情報学研究所
-
高須 淳宏
国立情報学研究所
-
鈴木 康平
東京大学大学院情報理工学系研究科
-
鈴木 康平
東京大学情報理工学系研究科
-
安達 淳
国立情報学研
関連論文
- 特徴点軌跡の不均一性パターンに基づいた同一場面映像検出(メディア処理,第12回画像の認識・理解シンポジウム推薦論文,画像の認識・理解論文)
- 知識ベースを用いた人名検索時の曖昧性の解消(言語処理,夏のデータベースワークショップDBWS 2006)
- 知識ベースを用いた人名検索時の曖昧性の解消(言語処理)
- 外部知識を用いて同姓同名の曖昧解消
- 言い換え箇所と言い換え候補の提示による解説文リライト支援の書き手の評価実験(言い換え・略語・要約)
- 情報リンケージのための統計的文字列類似度
- 高さの制限された無順序木の編集距離問題に対する近似アルゴリズム
- 混合ディリクレ分布を用いた文書分類の精度について(情報融合)
- 文書間類似度によるソフトウェアパターン間関連分析と複合関連の導出
- マージン最大化によるメトリック空間分割手法(一般,「ユビキタス,センサ環境におけるデータベース」,及び一般)