漢字の出現頻度特性を用いた日本語文献の機械処理
スポンサーリンク
概要
- 論文の詳細を見る
文献情報を有効に活用するには, 個々の文献に対してキーワード, 分類コード等の情報を的確かつ迅速に付与する必要がある。この要件を達成する一つの手段として, キーワードの自動抽出, 文献の自動分類が考えられる。これらに関する研究の多くは, 文献中に出現する単語を手がかりにするものである。しかし, 筆者らは, 日本語文献の場合そのキーワードの多くが漢字もしくはカタカナ表現されることに注目し, 単語ではなく文献中に出現する漢字を手がかりに, これらの情報を自動付与するいくつかの方法を考案し, 実験を行ってきた。本稿はこれらの方法の特徴, 実験成果を紹介し, あわせてその残された問題点を明らかにする。
- 独立行政法人 科学技術振興機構の論文
著者
-
諸橋 正幸
日本アイ・ビー・エム(株)東京サイエンティフィック・センター
-
細野 公男
慶應義塾大学 文学研究科
-
後藤 智範
愛知淑徳大学
-
細野 公男
慶応義塾大学文学部図書館情報学科
-
梅田 茂樹
日本アイ・ビー・エム サイエンス インスチテュート
-
原田 隆史
慶応義塾大学図書館・情報学科
-
守屋 智
野村コンピュータ・システム(株)
-
諸橋 正幸
日本アイ・ビー・エム(株)サイエンス・インスティチュート
-
原田 隆史
慶応義塾大学文学部
-
細野 公男
慶応義塾大学 文学部 図書館・情報学科
関連論文
- データベース照会システム「ヤチマタ」と名詞句データ模型
- 複合語の解析による語の上位一下位関係の自動構築
- 英米におけるIS研究・教育の動向
- 電気工学分野と周辺諸分野との関連度の分析 : ディスクリプタの出現頻度に基づいて
- 情報検索システムにおける効果的なナビゲーション機能の提案
- 電子図書館IV : ナビゲーションシステムプロトタイプ
- 電子図書館III : Information Outlining : 触ってわかる情報の輪郭
- 電子図書館II : 基本設計
- 電子図書館I : 将来像
- 図書館の資料提供サ-ビスに与えるオンライン検索の影響
- オンライン情報検索が冊子体購入に与える影響
- 第21回専門用語研究部会特別討論会報告
- 専門用語概論ターミノロジー, 仲本秀四郎著, 東京, 日本図書館協会, 2005年10月15日, B5., 93p., ISBN4-8204-0523-3, 定価: 1,050円(本体: 1,000円)
- ISO/TC37(ターミノロジー)における活動とその将来動向(情報知識学会 専門用語研究部会主催 : 第13回専門用語研究シンポジウム)
- 概念間の全体-部分関係に関する一考察 (「第12回専門用語研究会シンポジウム:東アジアにおける専門用語研究の新しい動向」から)
- 抄録からのキーワードの自動抽出
- 抄録からのキーワードの自動抽出
- 抄録からの主題文の自動抽出
- 構文情報を用いたキーワード抽出
- リレーショナル・データベース管理システム
- 図書館業務におけるOAとは (OA機器と図書館)
- 「情報検索の新たな展開 : テストコレクションからサーチエンジンまで」
- 実験計画法を用いたシミュレーションによる生産工程の性能解析 : 生産システムシミュレーションに関する研究(IV)(シミュレーション)
- 生産工程シミュレーションにおける要因計画法の適用 : 生産システム・シミュレーションに関する研究(III)(シミュレーション)
- 製造工程を対象にしたシミュレーション・システム(II) : シミュレーション・システムの適用
- 製造工程を対象にしたシミュレーション・システム(I) : シミュレーション・システムの概要
- 情報処理専門教育について 大学等における情報系専門教育の改善への提言
- 総説:ITがもたらした情報環境の変化
- 解説 図書館からみたナレッジ・マネージメント
- 電子図書館における検索 (創立40周年記念特集号) -- (特集 電子図書館とマルチメディア・ネットワ-ク)
- 知的情報システムへの道-5-システム志向から情報要求者志向へ
- 漢字の出現頻度特性を用いた日本語文献の機械処理
- 情報文化とは何か?
- デジタルコレクションの構築とその課題(資料のデジタル画像化と保存)
- インターネット経由で DIALOG を検索する際の利用者インターフェース : 適合度順出力機能を中心として
- 表現と関係の面からみた情報検索の課題(情報知識学会創立20周年記念特別号)
- 三訂 情報検索演習, 原田智子編著他, 東京 樹村房, 2006.10, 21cm×15cm, 203p, ISBN: 4-88367-131-3, 定価1,995円(税込み)
- 溝口理一郎, 『オントロジー工学』, オーム社, 2005, 275p.
- 斉藤 孝著, 『「記録・情報・知識」の世界 オントロジ・アルゴリズムの研究』, 中央大学出版部, 2004, A5, 344p., 3,150円, ISBN:4-8057-6149-0
- 会長に就任して
- INFOSTA Forum 第136回 ターミノロジーのすすめ
- デジタル化の方向とその意義
- 情報知識学会・第7回(1999年度)研究会報告会
- 会議の概要 ( ベルリン会議)
- 情報検索の高度化に向けて : 第19回ドクメンテーション・シンポジウム発表内容
- 自動索引 : 索引作業高度化の観点から(インデクシング(索引作成)の方法(8)(最終回))
- より人間的な情報検索システムの構築をめざして(21世紀の光の中へ)
- 斎藤 孝, パソコンRDBMS入門 : 代表的パソコンRDBMSの事例中心に(CQ Red Backs No.2), 東京, CQ出版社, 1984, A5, 211p., \1,700
- Lancaster F. W., Toward Paperless Information Systems., New York, Academic Press, 1978., xii, 197p., (Library and Information Science Series), ISBN 0-12-436050-5 \3,640
- JSIAIワークステーション(4) : 日本語ユーザモニター
- 概念間の関係に関する一考案 : 全体-部分関係を中心に(< : 小特集>「情報学」)
- The University Licensing Program (TULIP) : プロジェクト最終報告書(8)
- 「ことだま」文書処理システムの文節わかち書き仮名漢字変換
- テキストマイニング : 膨大な文書データからの知識獲得 : 概要
- テキストマイニング : 膨大な文書データからの知識獲得 : 意図の認識
- The University Licensing Program (TULIP) : プロジェクト最終報告書(7)(Z39.50)
- The University Licensing Program (TULIP) プロジェクト最終報告書(6)
- The University Licensing Program (TULIP) プロジェクト最終報告書(5)
- The University Licensing Program (TULIP) : プロジェクト最終報告書(4)
- The University Licensing Program (TULIP) プロジェクト最終報告書(3) (インターネットのおとし穴)
- The University Licensing Program (TULIP) プロジェクト最終報告書(2)
- 連載:The University Licensing Program (TULIP) プロジェクト最終報告書(1)
- 索引作業の今日的特徴と課題 (統制索引語に未来はあるか?)
- 第47回FID大宮大会を終って (第47回FID東京大会あれこれ)
- 9. 情報システム人材の教育体系の確立について ( ネット指向パラダイムを求めて)
- 全体会1 多様化の波に直面する専門図書館の課題(基調講演) (平成3年度〔専門図書館協議会〕全国研究集会)
- IFLAの発展--国際的な図書館活動におけるその重要性の増大
- 異種データに対する統合的情報検索
- Information Outlining : 検索情報の可視化 行政情報の活用のために
- 自立語辞書依存の少ない日本語文の形態素解析
- わが国におけるオンライン・データベースの利用実態
- 生産指示機能をもつ生産システム・シミュレータ(CIM要素技術の最前線)
- 生産指示機能をもつ生産システム・シミュレータ(CIMとその要素技術-現状と課題-)
- 第3回 図書館におけるデータ処理の管理(2)(〔要約〕情報システムの機械化)
- 福島原発事故への対処法-データ、情報、知識の観点から
- 自動索引付け研究の動向
- 文献,資料の自動分類 (分類--わが国の現況)
- 利用の側面からみた国産デ-タベ-スの特徴
- V.スティビッツ著, 中村幸雄監訳, 神谷淑子, 西尾治一共訳, 知的生産の技術と方法 : ツール・オブ・マインド, オーム社, 1984, A5, 329p., \4,800
- ファジィ集合理論に基づく重み付き文献検索システム
- 情報検索サ-ビスの利用コストと利用料金に関する一考察
- 協会名を考える(6)
- キ-ワ-ド群を対象とした自動語彙変換システム
- COM目録の利用と現状
- 国立国会図書館サーチとディスカバリインタフェース
- Project Next-LとNext-L Enju 日本初のオープンソース統合図書館システムの開発と現状
- 知的情報システムへの道 (5)
- 漢字の出現頻度特性を用いた日本語文献の機械処理
- 図書館の資料提供サービスに与えるオンライン検索の影響
- オンライン情報検索が冊子体購入に与える影響
- 歴史GISの地平 景観・環境・地域構造の復原に向けて, HGIS研究協議会編(川口洋(代表)・石崎研二・後藤真・関野樹・原正一郎), 勉誠出版, 2012年3月30日, B5, 288p., ISBN:978-4-585-22022-0, 定価4,200円(本体価格4000円)
- Busha, Charles H. and Harter, Stephen P., Research Methods in Librarianship : Techniques and Interpretation., New York, Academic Press, 1980., xii, 417p., (Library and Information Science), ISBN 0-12-147550-6
- 個人用情報検索システムACQUIREの開発
- LISAデ-タベ-スの特色と利用上の考慮事項--索引ファイルの観点から
- 電子計算機を使用した主題検索におけるLC件名標目の問題点
- タイトル無し
- 多段階抽選ゲームでの反応時間に対する結果パターンの効果3(日本基礎心理学会第31回大会,大会発表要旨)
- Q & A
- 第4回 図書館におけるデータ処理の管理(3)(情報システムの機械化)