目次と帯を用いた図書の自動分類(情報検索・分類,テーマ : 「デジタルアーカイブの活用(応用)」および一般)
スポンサーリンク
概要
- 論文の詳細を見る
書名だけでなく目次や帯情報を用いて,図書を日本十進分類法の分類カテゴリに自動分類する実験を行った。分類手法には,相対出現率と相互情報量にもとづく重み付けとSupport Vector Machine (SVM)による手法を用いた。「BOOK」データベースとNII-CATデータを統合した24,000件を用いて学習させたところ,重み付けに相対出現率と相互情報量を用いた場合は,書名に加えて目次と帯情報を用いた場合の効果が認められた。また,機械学習手法よりも,統計的手法のほうが有効であった。分類カテゴリの分野ごとの再現率を調べたところ,分野によって再現率に大きな差があった。さらに,帯情報などが有効な分野もあり,書名,目次,帯を用いた効果が分野ごとに異なることが明らかになった。
- 社団法人情報処理学会の論文
- 2006-03-22
著者
-
宮田 洋輔
慶應義塾大学大学院文学研究科図書館・情報学専攻
-
上田 修一
慶應義塾大学文学部
-
石田 栄美
駿河台大学
-
神門 典子
国立情報学研究所
-
神門 典子
国立情報学研究所情報社会相関研究系:総合研究大学院大学
-
石田 栄美
国立情報学研究所
-
神門 典子
国立情報学研
-
神門 典子
学術情報センター研究開発部
-
上田 修一
慶應義塾大学
-
宮田 洋輔
慶應義塾大学
関連論文
- Qサイトにおけるベストアンサー推定の分析とその機械学習への応用
- 読書行為の次元 : 成人を対象としたフォーカス・グループ・インタビュー
- 画面遷移と利用者特性からみた大学生におけるOPACの閲覧
- テレビニュース視聴への情報重複性の効果--眼球運動測定と確認テストによる分析
- プーリング手法を用いた学術論文の自動判別実験(セッション2:情報のラベリングと知識の獲得,学生チャレンジ特集)
- 目次と帯を用いた図書の自動分類(情報検索・分類,テーマ : 「デジタルアーカイブの活用(応用)」および一般)
- 図書館情報学研究における「根拠(エビデンス)」(図書館情報学の研究動向と新たな流れ)
- 機械学習手法による著作の自動同定
- NTCIR-3言語横断検索タスクの分析 : プーリングを中心として
- 大規模テストコレクション構築のためのプーリング : NTCIR-3言語横断検索タスクの分析(コーパス分析・言い換え)(セマンティックウェブと自然言語処理その他一般)
- LL_011 コンテンツを組織化する知識コンテンツ構築システムの提案(L分野:ネットワークコンピューティング)
- 協調学習のためのコンテンツ構築システムEduWikiの開発(セッション7: 社会システム・教育支援システム)
- 時系列情報の値と変化に関する言語表現コーパスの構築 : 動向情報の情報編纂に向けて
- タスク種別とユーザ特性の違いがWeb情報探索行動に与える影響: : 眼球運動データおよび閲覧行動ログを用いた分析
- サーチエンジン検索結果ページにおける視線情報の分析(第17回(2009年度)年次大会(研究報告会&総会))
- 〈情報処理学会 第100回情報基礎とアクセス技術研究会(IFAT) 発表論文〉Q&Aサイトにおける質問と回答の分析(4) : 質問タイプ分類の一致度について(立命館大学 びわこ・くさつキャンパス エポック立命21. 2010年11月4日)
- Concentric Ring View F+ : マルチメディアデータのためのリング状検索インタフェース(ユーザインタフェースとインタラクティブシステム)
- Concentric Ring View F+ : マルチメディアデータのためのリング状検索インタフェース
- Q&Aサイトにおけるベストアンサー推定の分析とその機械学習への応用
- NTCIRにおける質問応答技術の評価と今後の展望(NTCIR特別セッション)
- Basic Elementを用いた質問応答の自動評価(情報検索・情報抽出・QA)
- 人の価値観を表すカテゴリを対象にした複数カテゴリへの自動分類の試み
- Web情報探索における視線データの予備的分析(創立20周年記念 第16回(2008年度)年次大会(研究報告会&総会))
- 多面的な検索とブラウジングを統合したGUI(セッション3 : GUIデザイン)
- 特許情報処理を指向したテストコレクションの構築 : 情報検索と自然言語処理の融合を目指して(NTCIR特別セッション)
- 特許情報処理を指向したテストコレクションの構築 : 情報検索と自然言語処理の融合を目指して(NTCIR特別セッション)
- 情報アクセス対話のための質問応答技術評価タスク
- NTCIRにおける質問応答技術の評価と今後の展望(NTCIR特別セッション)
- Basic Elementを用いた質問応答の自動評価(情報検索・情報抽出・QA)
- 「エビデンス・ベースト・ライブラリアンシップ」(EBL)の枠組みの検討 : 日本の図書館情報学文献の実態に基づいて
- プーリング手法を用いた学術論文の自動判別実験(セッション2:情報のラベリングと知識の獲得,学生チャレンジ特集)
- 『時事新報』初期の社説の著者推定
- 「情報専門職の養成に向けた図書館情報学教育体制の再構築」研究班の最終報告会記録
- 「情報専門職の養成に向けた図書館情報学教育体制の再構築に関する総合的研究」最終報告書
- 三浦逸雄監修, 『図書館情報学の地平 : 50のキーワード』, 日本図書館協会, 2005, 353p.
- オープンアクセスを想定した日本語学術論文ファイルの自動判定(デジタルアーカイブの応用,テーマ : 「デジタルアーカイブの活用(応用)」および一般)
- 目次と帯を用いた図書の自動分類(情報検索・分類,テーマ : 「デジタルアーカイブの活用(応用)」および一般)
- オープンアクセスを想定した日本語学術論文ファイルの自動判定(デジタルアーカイブの応用,テーマ : 「デジタルアーカイブの活用(応用)」および一般)
- 日本の図書館情報学分野の教員の経歴と論文生産性
- 大学図書館トップページのガイドライン
- Webページの有用性に関する分析 : 特徴語の抽出と被リンク数の比較(Webマイニング)
- WWWにおける有用性の高いページの特定手法について
- 情報源としてのWWW (日米政府の電子化文書を使った多言語アーカイブ・サイトの開発)
- 大学図書館のホームページとOPACを採点する (情報とデザイン)
- 動向情報の要約と可視化とその展開 : MuST(動向情報の要約と可視化に関するワークショップ)活動報告(言い換え・略語・要約)
- 動向情報の要約と可視化 : 言葉と図で情報をまとめる
- NTCIR-4における類似特許検索テストコレクションの構築(テキスト検索,分類)
- 特許コーパスを用いた検索タスクの提案
- Q&Aサイトにおける質問と回答の分析(4)-質問タイプ分類の一致度について-
- 日本十進分類法と基本件名標目の相互マッピングの試み
- Q&Aサイトにおけるベストアンサー推定可能性の検証
- Q&Aサイトにおけるベストアンサー推定可能性の検証
- Web上のexploratory searchの特徴:発話プロトコルと事後インタビュー分析結果より
- 新聞記事とコミュニティQAを対象とした詳細な意見分析コーパスの作成と分析
- 新聞記事とコミュニティQAを対象とした詳細な意見分析コーパスの作成と分析
- Wikipediaを介した関連ニュース・ブログの対応付け? Wikipediaエントリの分析?
- 特定トピックの日英ブログ収集・分析・類型化:事例研究
- 特集「NTCIR : 情報アクセスに関わるテキスト処理技術の評価ワークショップ」にあたって(NTCIR : 情報アクセスに関わるテキスト処理技術の評価ワークショップ)
- 大規模テストコレクションNTCIR-2の構築 : 対話型追加検索と言語横断的プーリングの効果(情報の検索とテストコレクション)
- 多段階レレバンス判定による評価 : 平均可能な単一指標の検討
- 大規模テストコレクションNTCIR-2の構築 : 言語横断的プーリングの評価への影響
- 大規模学術情報データベースに適した情報検索システムの開発
- 大規模テストコレクションNTCIR-1 NTCIR-2 : レコードから見た違い
- 大規模テストコレクション NTCIR-1 と NTCIR-2 : レコードから見た違い
- 映像の分析と視聴者調査からみたテレビニュースの形式と内容の変化
- テレビニュース視聴への情報重複性の効果 : 眼球運動測定と確認テストによる分析
- Q&Aサイトにおける質問と回答の分析(3)-質問・回答履歴を用いたベストアンサー推定-
- 「学術用語集 図書館情報学編」改訂の経緯
- テキスト自動分類の概要(情報のフィルタリング)
- 日本語学術論文PDFファイルの自動判定
- テキストの自動分類に関わる諸要素
- WWW上のOPACにおける既知事項検索の諸問題
- WWWページの自動分類 : NDCの分類体系とYahooのカテゴリを使った分類
- 紙の印刷物は電子媒体より強い--紙の現在と電子図書館への疑問 (特集:電子図書館と「紙」の世界)
- 専門書はどれほど図書館で購入されるか
- 21世紀も本と雑誌は紙のまま (特集 「21世紀へ向けての医学図書館」)
- 学術情報流通における深層ウェブの実態--機関リポジトリに収録された文献を用いた調査
- テレビニュースと新聞におけるエピソード型フレームとテーマ型フレーム--総選挙報道の分析
- 画像の認知の枠組みと索引法
- CD-ROMとCD-I
- 科学技術情報 : 利用者の立場から : 科学技術文献を利用した研究・開発動向把握の方法(情報と企業活動(13))
- keyword, descriptor, non-descriptor, identifier, free-word, catchword
- インターネットのサーチエンジンの評価尺度 : ESL (Expected Search Length) を使った検索実験
- 絵画データベースの検索手法 : ベクトル型検索手法の可能性
- ベクトル型検索手法による絵画データベースの検索
- 絵画の索引法 : 段階的絵画解釈を応用した三つの索引法によるデータベースの作成と評価
- 日本の図書館目録における書誌的家系--J-BISCにおける調査と先行研究との比較分析
- 大学図書館における電子情報源の利用者教育調査
- 経済学研究者の電子メディア利用
- 深層ウェブの実態とその要因 : 機関リポジトリに登録された文献を用いた調査
- 電子図書館の光と影
- 感性キーワードの発展とその限界
- Z39.50とその可能性(Z39.50)
- 6. 絵画データベース : 索引法と検索法を中心に (人文・芸術系のデータベース : 今そしてこれから)
- 相互協力とネットワーク : 『大学図書館研究』の50号に基づいて
- 1996年度 『学会賞』 選考結果
- 日本の大学図書館のOPACの現状
- 図書館・情報学研究論文のトレンド--国内雜誌掲載論文の内容分析を中心として
- 著作同定における目録作成者間の一貫性
- JAPAN/MARCレコードから自動構築可能な著作識別子の提案