構造と構成要素に基づく学術論文の自動判定
スポンサーリンク
概要
- 論文の詳細を見る
ウェブ上に存在するPDFファイル群から学術論文を自動的に判定する手法の開発を目的とした。まず,学術論文の構成要素と構造がどのように発達してきたかを調査した。英語と日本語の学術論文1,172件に対して,それらが顕れているかを調査した。その結果,論文は共通した構成要素を有しており,見出しを持つ論文のうち40%近くがIMRAD形式またはそれに近い構造を採っていた。次に,これらの結果をもとに,学術論文を自動的に判定するためのルールを構築した。ウェブ上から無作為に収集した英語と日本語のPDFファイル集合を用いて判定性能を実験したところ,ランダムフォレストによる判定器を用いた場合,F値は英語集合では0.74,日本語集合では0.53であった。これらの結果から,本研究で用いたアプローチにより構築した判定ルールにより,ウェブ上に存在するPDFファイル群から学術論文を自動的に判定できる可能性が示唆された。
- 2014-03-31
著者
関連論文
- プーリング手法を用いた学術論文の自動判別実験(セッション2:情報のラベリングと知識の獲得,学生チャレンジ特集)
- プーリング手法を用いた学術論文の自動判別実験(セッション2:情報のラベリングと知識の獲得,学生チャレンジ特集)
- 『時事新報』初期の社説の著者推定
- オープンアクセスを想定した日本語学術論文ファイルの自動判定(デジタルアーカイブの応用,テーマ : 「デジタルアーカイブの活用(応用)」および一般)
- オープンアクセスを想定した日本語学術論文ファイルの自動判定(デジタルアーカイブの応用,テーマ : 「デジタルアーカイブの活用(応用)」および一般)
- Webページの有用性に関する分析 : 特徴語の抽出と被リンク数の比較(Webマイニング)
- WWWにおける有用性の高いページの特定手法について
- 日本語学術論文PDFファイルの自動判定
- 仮想評価法による公共図書館の経済評価
- WWWページの自動分類 : NDCの分類体系とYahooのカテゴリを使った分類
- 学術情報流通における深層ウェブの実態--機関リポジトリに収録された文献を用いた調査
- 公立図書館の蔵書構成比と貸出規則に関する実態調査
- 動向レビュー 図書館のもたらす経済効果
- 公共図書館の生産関数と効率性の分析
- 図書館評価研究における経営学的アプローチ (特集 図書館パフォーマンス指標と経営評価の国際動向)
- 異なるデータ長に対応したデータ圧縮による類似データ同定 : 近代日本文学データの著者推定による検証
- 異なるデータ長に対応したデータ圧縮による類似データ同定 : 近代日本文学データの著者推定による検証(セッション1: 言語情報・情報検索)
- 異なるデータ長に対応したデータ圧縮による類似データ同定 : 近代日本文学データの著者推定による検証(セッション1: 言語情報・情報検索)
- Web調査におけるサンプル集合の収集法 (佐賀健二先生退職記念号)
- 情報検索における順位付け出力の優位性 : 戦略的な検索行動として最適採餌理論を導入した場合
- 第55回日本図書館情報学会研究大会シンポジウム記録 : 「図書館情報学におけるエビデンスベーストアプローチ」
- インタ-ネットのサ-チエンジンの評価尺度 (『1998年情報学シンポジウム』プログラム--WWW情報検索・電子図書館・セキュリティ・著作権・マルチメディア情報流通・感性情報処理) -- ((セッション8)WWW情報検索)
- インターネットのサーチエンジンの評価尺度 : ESL (Expected Search Length) を使った検索実験
- 絵画データベースの検索手法 : ベクトル型検索手法の可能性
- ベクトル型検索手法による絵画データベースの検索
- 公共図書館の最適規模に関する実証的研究
- 公共図書館における費用便益分析
- 大学図書館効果の次元
- 表示媒体が文章理解と記憶に及ぼす影響-電子書籍端末と紙媒体の比較-
- 複数の圧縮プログラムを用いた近代日本文学の著作推定
- 深層ウェブの実態とその要因 : 機関リポジトリに登録された文献を用いた調査
- 図書館はどのような本を所蔵しているか : 2006年上半期総刊行書籍を対象とした包括的所蔵調査
- 所蔵状況による九州地域図書館システムの分析
- 図書館はどのような本を所蔵しているか : 2006年上半期総刊行書籍を対象とした包括的所蔵調査
- 10E06 アクティブラーニングを促進するための新しいソーシャルラーニングシステムの開発・評価(高等教育の実践と研究(教育システム、IR、eラーニング、教員研修等含む),課題研究)
- 構造と構成要素に基づく学術論文の自動判定