日本語形態素解析への複数ハッシュふるい分けの応用
スポンサーリンク
概要
- 論文の詳細を見る
最近、大きなメモリが利用できるようになり、並列処理が普及しつつある。自然言語処理のアルゴリズムはこの変化を反映する必要がある。しかしメモリが大きくなっても、長い語長のキーをきわめて多数持つ辞書を、通常のハッシュ表にすることは、必ずしも常に可能ではない。本研究では「複数ハッシュふるい分け」の形態素解析への応用について述べる。「ふるい分け」とは、与えられたキーがあるデータ集合中に存在するかどうかを調べることである。複数ハッシュふるい分けでは、複数のハッシュアドレス生成に互いに独立なn個の異なるハッシュ関数を使用し、ハッシュ表の該当アドレスにはデータの存在を示す1ビットのフラグを置く。探索時には同じハッシュ関数のセットを用いて探索キーをハッシュし、すべてのアドレスの内容が1であれば、辞書中のキーと一致したとみなす。この方法ではハッシュ表が比較的小さくなり、また並列処理の適用が容易である。また、本研究では長い文字列を「畳み込む」ためのアルゴリズムについても検討する。
- 一般社団法人情報処理学会の論文
- 1993-09-27
著者
関連論文
- 「東大集書ファイル」の拡張と問題点
- TOOL-IR(オンライン情報サービス(9))
- 「東大集書ファイル」データベースの実験
- 第2回コンピュ-タ会議,ライブラリ-オ-トメ-ションのセッションについて (図書館と情報システムに関する国際動向)
- 第2回コンピュ-タ会議,ライブラリ-オ-トメ-ションのセッションについて (図書館と情報システムに関する国際動向)
- 学会誌データベースの作成とその利用と研究(第4回ドクメンテーション・シンポジウム概要)
- 日本最初のオンライン情報検索サービスTOOL-IR : 研究・開発・サービス提供(オンライン情報検索:先人の足跡をたどる(2))
- ディジタルシルクロード・プロジェクトの展開
- 貴重書ディジタルアーカイブにおけるテキスト可読性と異種メディア間共参照アノテーション
- A-5 法帖の情報解析(テキストからの接近)
- ユニークタイトルの電子アーカイブ(1):予備的統計と保存の提案
- 「かたい本」はどうなるか, どうすればよいか(インタラクティブ・エッセイ)
- 分野判定のために用いられる単語リストの作成と応用
- WWWによる図書目録データベースの提供実験
- ANSI標準プロトコルZ39.50を用いた日本語検索・試作システムの実演
- 日本のWorld Wide Web情報空間 : 1996年1月のリンクデータ解析
- Z39.50を用いた日本語書誌情報サーバの試作
- ディジタル図書館のフロントエンド/バックエンド機能
- 多数の語を用いた検索質問の作成と評価
- べた書き文の自動分節化によるインターネット上の多言語検索システム
- WWWによるJAPAN/MARCの提供実験
- B-3 非線形光学材料情報における意味関係の抽出と情報の構造化(専門分野知識)
- NEXTSTEPを用いたCASEツールの試作
- 特別講演:電子図書の将来と図書館 (第24回ドクメンテーション・シンポジュウム)
- 電子会議の利用による組織内情報流通の変化
- 電子図書館員の仕事とその道具
- 複数ハッシュふるい分け法の日本語情報システムへの応用
- FID/ET (Education and Training Committee) (第47回FID東京大会あれこれ)
- 各種システムにおける人間的側面 情報検索システム (計算機システムにおける人間的側面)
- パネル討論会 : 利用者・開発者それぞれの世界と役割
- 日本語形態素解析への複数ハッシュふるい分けの応用
- 情報システム
- 図書館情報大学の情報検索システム
- 図書館情報大学の図書館システム : 第13回ドクメンテーション・シンポジウム概要
- 図書館情報大学の情報検索システム : 第13回ドクメンテーション・シンポジウム概要
- 電子図書館における図書館員像と専門図書館の役割 (特集 電子化環境における専門図書館の役割)
- 電子図書と専門図書館サ-ビスの将来像--変容する薬学情報への対応:電子ライブラリ-の戦略的活用 (特集 日本薬学会第116年会薬学図書館協議会部会)
- 学術情報の特質と国際流通(第7回学術情報センターシンポジウム報告 1)
- これからの社内情報化 [第4回]
- データベースの今後の動向(その1) : 特にCD-ROMを中心に
- 大学図書館ト-タル・システムLIAISONの開発過程に関する定量的分析
- 図書館情報大学の情報システム : 第13回ドクメンテーション・シンポジウム概要
- 図書館情報大学の情報システムについて
- 情報システム評価の諸問題-1-TOOL-IR利用者アンケ-トの調査分析を事例として
- 情報システム評価の諸問題-1-TOOL-IR利用者アンケ-トの調査分析を事例として
- オンライン文献情報検索システム・TOOL-IR におけるマン・マシン・インターフェース
- 化学文献における日本人名のロ-マ字化〔英文〕 (〔慶応義塾大学文学部図書館・情報学科〕創立二十五周年記念特集号)
- 化学文献における日本人名のロ-マ字化〔英文〕 (慶応大学文学部図書館・情報学科創立二十五周年記念特集号)