近代文献のデジタルアーカイブ化とテキストマイニング-岩波書店「思想」を題材に
スポンサーリンク
概要
- 論文の詳細を見る
本研究の目的は,1921年に創刊された岩波書店『思想』90年分(約1000号,約8600論文,約16万ページ)を題材とし,電子化・構造化を行うことで,a)『思想』という知の集積,分析により20世紀日本の哲学・思想史を明らかにすること,b)分析結果の学部・大学院教育での活用の方法論構築を進めること,及びc)歴史的文献テキストの電子化,アーカイブ化に関する方法論を確立すること,である.本稿では,上記『思想』のデジタルアーカイブ化とテキストマイニングに関し,『思想』雑誌の電子化・構造化の手順とその問題点を報告し,特に,OCRによる文字認識精度の向上,自動化・システム化に向けたレイアウト解析ソフトウェアの開発について,現状の取り組みと予備的に行った実験評価について報告する.
- 2012-07-28
著者
-
美馬 秀樹
東京大学
-
美馬 秀樹
ATR音声翻訳通信研究所
-
太田 晋
東京大学
-
美馬 秀樹
東京大学大学院工学系研究科
-
美馬 秀樹
東京大学工学系研究科
-
美馬 秀樹
徳島大学工学部知能情報工学科
-
美馬 秀樹
東京大学大学院工学系研究科工学教育推進機構
-
美馬 秀樹
徳島大学
-
丹治 信
東京大学知の構造化センター
-
増田 勝也
東京大学知の構造化センター
-
太田 晋
東京大学工学系研究科|知の構造化センター
-
美馬 秀樹
東大
-
美馬 秀樹
東京大学工学系研究科|知の構造化センター
関連論文
- 言語データマネージメントのための言語タグを利用した区間演算と区間検索
- 類似検索を用いた情報検索システム
- 6-322 理科教育から工学教育への連携を意識した学習支援プログラムの設計 : 小中高から大学へ((18)工学教育システムの個性化・活性化-I,口頭発表論文)
- 用語抽出技術を利用したテキスト分類(フィルタリング、文書分類)(テーマ:「Webマイニングによる情報活動と自然言語処理」その他一般)
- 用語抽出技術を利用したテキスト分類(フィルタリング、文書分類)(テーマ:「Webマイニングによる情報活用と自然言語処理」その他一般)
- P2Pコンテンツ交換システムにおけるコンテンツの整合性維持および全文検索の高度化(セッション2 : マルチメディアシステム)
- JLUGM--日本Lispユーザ会議(3)次世代Web技術としての動的サーバ技術--マルチスレッドLispによる可能性
- 社会的役割の考慮による対話翻訳の精度向上
- 同時通訳システムの実現に向けた漸進的翻訳処理
- 課題志向別シラバス自動分類システムの設計と実装
- 10-106 課題志向別シラバス自動分類システムの開発(口頭発表論文,(14)教育ソフトウェア)
- 課題志向別シラバス自動分類システムの設計と実装
- MIMAサーチ : 可視化によるEメールセキュリティの高度化
- 工学知の構造化とカリキュラム構造の可視化
- 用語抽出技術を利用したテキスト分類
- 自然言語処理における単位の設定--意味のまとまりの認識と利用 (特集 ことばの単位--言語の分析的探究のための手立て)
- 17aD04 自然言語処理を用いた結晶成長モデリング支援に関する研究(結晶成長基礎(1),第35回結晶成長国内会議)
- LR(1)構文解析表の動的構成法
- ユニフィケーションによる事例検索
- 自然言語インタフェースにおける間接発話文の意図理解法
- 生命科学における知の構造化
- タグアノテーション付テキスト検索を用いたオンラインマイニング
- 自然言語インタフェースにおける間接発話文の意図理解法
- 自然言語入力に対する知的コマンドインターフェイスICIにおける入力文の意図理解
- 近代文献のデジタルアーカイブ化とテキストマイニング-岩波書店「思想」を題材に
- 遺伝的プログラミングにおける部分構造の推移の可視化
- 岩波書店『思想』の構造化
- Furrer, L. and Volk, M.: Reducing OCR errors in gothic-script documents(ブラックレター書体の文書に対するOCR誤り訂正),Proc. Workshop on Language Technologies for Digital Humanities and Cultural Heritage, pp. 97-103(2011)
- 2. 知の構造化による工学教育の可視化・構造化と教育社会学への適用(課題研究II 教育社会学教育のあり方を問う,課題研究)
- 8-340 PBLにおける課題解決に向けた議論の検証 : 課題解決に向かう議論とはどのような議論なのか((15)工学教育システムの個性化・活性化-II)
- MIMA Searchを用いた修士論文とシラバスのテキスト分析「文化資源学の射程」研究プロジェクト報告