ダブル配列におけるキー削除の効率化手法
スポンサーリンク
概要
- 論文の詳細を見る
トライ法は自然言語処理システムの辞書を中心として広く用いられているキー検索技法であり,トライを実現するデータ構造に検索の高速性と記憶量のコンパクト性をあわせ持つダブル配列構造がある.ダブル配列構造の欠点は,キーの削除によって生じる未使用要素により空間効率が低下する点である.これに対し森田らはダブル配列を詰め直すことにより未使用要素を除去するキー削除法を提案した.しかし,この手法はすべての未使用要素を除去できないため高い空間効率を維持できず,また削除コストが未使用要素数に依存するので,削除を連続するほど削除速度が低下するという問題がある.本論文では,トライの節のうち兄弟を持たない節が多くの割合を占めること,また,これらの節の遷移は容易に変更できるという特徴を利用し,削除を連続した場合でも空間使用率と削除速度を低下させない効率的なキー削除法を提案する.EDR日英単語辞書,WordNet英単語辞書,日本の郵便番号リスト,各5万件に対する実験より,提案法は削除を連続した場合でもきわめて高い空間使用率を維持することが,また,森田らの削除法より約50〜200倍高速に削除できることが実証された.
- 2003-05-15
著者
-
泓田 正雄
徳島大学工学部知能情報工学科
-
森田 和宏
徳島大学工学部知能情報工学科
-
青江 順一
徳島大学工学部知能情報工学科
-
森田 和宏
徳島大学知能情報工学科
-
大野 将樹
徳島大学工学部
-
大野 将樹
慶應義塾大学理工学部
-
泓田 正雄
徳島大学大学院ソシオテクノサイエンス研究部
-
青江 順一
徳島大学大学院ソシオテクノサイエンス研究部
-
泓田 正雄
徳島大学大学院 ソシオテクノサイエンス研究部
-
青江 順一
徳島大学大学院 ソシオテクノサイエンス研究部
関連論文
- 複合語の分野連想語の効率的決定法
- 日本語定型表現のパターン記述規則と効率的な照合アルゴリズム
- 意味変化率を考慮した文書短縮方法
- 日本語定型表現の分析と効率的照合アルゴリズム
- 活用語を含む助詞的定型表現の分析
- ダブル配列におけるキー削除の効率化手法
- 周波数スペクトルの谷状点系列による和音推定(音高・和音・調認識)
- 探索木法とその応用 ( キー検索技法 3)
- 大規模文書データに対する用例文の効率的検索アルゴリズム
- E-029 主旋律に着目したピアノ楽譜の難易度別簡易化(自然言語・音声・音楽,一般論文)
- RE-001 周波数スペクトルの谷状点に基づく和音推定(自然言語・音声・音楽,査読付き論文)
- 接頭辞ダブル配列における空間効率を低下させないキー削除法(情報検索)
- ダブル配列におけるキー削除の効率化手法
- ダブル配列における動的更新の効率化アルゴリズム
- 複合語生成規則を用いたキーワード導出手法
- パターンマッチングマシンの効率的記憶検索法
- 多属性項目の履歴情報に基づく電子メイル文書のフィルタリング手法
- 多属性項目の履歴情報に基づく電子メイル文書のフィルタリング手法
- 各個人のプロファイルを用いたメイル文書のフィルタリング手法
- 履歴情報を考慮したメイル文書のフィルタリング手法
- 行置換によるスパース行列の効率的縮小アルゴリズム
- 分野連想語の出現位置に基づく話題分野の特定手法
- 分野連想語を用いたパッセージ特定手法
- 6A-7 順序木の簡潔表現を用いたトライ辞書の評価(アルゴリズム,一般セッション,ソフトウェア科学・工学,情報処理学会創立50周年記念)
- RD-002 重複レコードの多い大規模トライ辞書の圧縮(データベース,査読付き論文)
- 転置ファイルによる大規模 n-gram データの検索システム
- 転置ファイルによる大規模 n-gram データの検索システム
- 2S-5 共起関係に基づく階層型単語概念体系の動的構築法(自然言語処理一般,学生セッション,人工知能と認知科学)
- 3B-6 ダブル配列による動的辞書の構成と評価(アルゴリズムとその応用,一般セッション,ソフトウェア科学・工学)
- パトリシアトライに対する簡潔な配列表現
- LD_008 ダブル配列におけるキャッシュの効率化(D分野:データベース)
- 2次記憶上のダブル配列の効率的検索法
- キーワードの遅延抽出を考慮した文書検索構造の効率的構成法
- トライ構造を用いた共起情報の効率的検索アルゴリズム
- 特徴ベクトルによる全文検索の一改善法
- 拡張ハッシュ法における部分文字列検索の設計と実現
- トライ構造を用いた共起情報の効率的検索アルゴリズム
- グラフ構造に対する効率的記憶検索法
- 文書レイアウトにおける自動図表配置手法
- 特徴ベクトルを用いた全文検索における高速化手法
- ストリングパターンマッチングマシンの文字列置換への拡張法
- ストリングパターンマッチングマシンの動的構成法
- 片仮名異表記の生成および統一手法
- ストリングパターンマッチングマシンにおける検索キー追加方法
- LRパーサを用いた文字列置換アルゴリズム
- 形態素置換による文書短縮法
- 階層化による2進ディジタル探索(BDS)木の改善
- 拡張ハッシュ法による検索技法の拡張 : 部分文字列検索と順検索への拡張
- 時間推移を考慮した単語の重要度決定手法
- 格構造解析における概念階層の効率的判定アルゴリズム
- キーワード抽出を用いた文書自動分類手法
- パトリシアトライ構造の効率的な圧縮アルゴリズム
- 知識表現モデルMERMにおける定量化の一表現法
- 2進木トライ構造の効率的な圧縮手法
- トライ構造による概念階層の高速判定アルゴリズム
- 階層化概念辞書の高速検索アルゴリズム
- (96)徳島大学工学部知能情報工学科における創成型科目への取り組み : ネットワークを用いた対戦型ゲームのグループによる作成(第24セッション 創成教育(IV))
- 連載講座「キー検索技法」の編集にあたって
- ソフトウエア製品ニュースからの開発傾向の抽出(抽出(1))
- 大学で育成すべき自然言語処理技術者とは?
- 画像,音声,テキストに対するマルチデータ処理技術の統合化とその応用
- HTML形式の表構造に対する一索引化手法
- HTML形式の表構造に対する一索引化手法
- WWW空間上に存在する表構造の一索引化手法
- キーワード構成の分析とその応用
- 接続情報を加味した形態素辞書による形態素解析の高速化
- LR(1)構文解析表の動的構成法
- 日本語時間表現の一解釈法
- 日本語文における時間表現の形式化手法
- 携帯電話情報サービスのための新聞記事要約の研究
- 新製品ニュース管理システムのための文と段落のタイプ抽出方法
- 4V-6 技術解説記事データベースのためのXML文書作成ツールの開発
- テキストベースの一提案
- 画像,音声,テキストに対するマルチデータ処理技術の統合化とその応用
- 自然言語インタフェースにおける間接発話文の意図理解法
- 類似用例文の効率的検索手法とその応用
- 二つのトライを用いた辞書検索アルゴリズム
- トライ構造における共通接尾辞の圧縮アルゴリズム
- 自然言語インタフェースにおける間接発話文の意図理解法
- 自然言語入力に対する知的コマンドインターフェイスICIにおける入力文の意図理解
- パージングテーブルによる弱順位パーザの構成法
- 文字列照合マシンを利用した複合語キーワードの効率的抽出法
- パージングテーブルによる弱順位パーザの補足
- 文脈自由言語に対する構文解析部の自動生成
- BCH符号によるミニコンピュータ結合システムの誤り制御
- J-010 接触機能を持つ音声対話ロボットに関する研究(HCI(2),J分野:ヒューマンコミュニケーション&インタラクション)