形態素解析を用いた中間部分一致検索の高速化手法
スポンサーリンク
概要
- 論文の詳細を見る
本論文ではあらかじめ形態素解析を用いて階段状にインデックスレコードを派生させておくことによって, 検索時の中間部分一致を高速化する手法について述べる. 本手法は, PB入力型電話番号検索実験システムにおけるデータベース検索を高速化する目的で検討を進めてきたものである. 本論文は, 全文検索の分野でのPAT木に着目し, 各レコードごとにPAT木における半無限部分文字列(sistring)に似た階段状のインデックスレコードを派生させ, それをDBMSで管理することによって, 各レコードの中間部分一致を高速化するものである. 評価実験の結果, 本手法は, 速度面, 性能面, 精度面で番号検索のタスクに要求される条件をかなりのレベルで満足することが検証できた.
- 一般社団法人情報処理学会の論文
- 1997-09-11
著者
-
奥 雅博
Nttサイバーソリューション研究所
-
奥 雅博
NTT情報通信研究所
-
野田 良輔
NTT情報通信研究所
-
林 智定
NTT情報通信研究所
-
野田 良輔
(株)NTT PC コミュニケーションズ
-
林 智定
(株)NTTデータ
関連論文
- オペレータレス自動電話番号検索システムの開発
- 形態素解析を利用したデータベース検索高速化方法
- PB電話機を利用した日本語入力方式
- オペレータレス自動電話番号検索システムに適した部分一致検索手法
- 音声による姓名同音異字候補の特定方法に関する検討
- PB入力型電話番号検索実験システムに用いる漢字説明文の評価
- 形態素解析を用いた中間部分一致検索の高速化手法
- 形態素解析を用いた中間部分一致検索の高速化手法
- 文字連鎖を用いた複合語同音異義語誤りの検出手法とその評価
- PB電話機を利用したデータベース検索における漢字情報の利用方法
- PB電話機を利用した電話番号案内方式に適した対話誘導戦略
- 関連記事の判定に関する検討
- 情報探索におけるGUIに関する一考察
- 数値情報説明のための文生成技術
- 日本文解析における述語相当の慣用的表現の扱い
- 日本語文書に含まれる固有用語の自動抽出方式
- 意味カテゴリを用いたサ変動詞同音異義語誤り検定方式
- 89-23 意味的な曖昧さを越えて
- 意味カテゴリを用いた複合語の同音異義語誤り検定方式
- 日英翻訳システムALT-J/Eにおける日英変換技術
- 対話型データベース検索システムにおける先行検索機能の導入について
- PB入力型電話番号検索実験システム
- 文字区切り・単語区切りを用いた検索解の絞り込み効果の検討 : PB電話機を利用したデータベース検索への適用
- PB電話機を利用した電語番号案内技術
- C言語記述プログラムの移植性について
- 移植阻害要因の定量化手法の検討
- テスト工数に着目した移植コストモデルの検討
- 結合価構造に基づく「鼻が長い象」型埋め込み名詞句の解析
- 結合価構造に基づく日本語二重主格形容詞構文の解析
- 日本文推敲支援システムREVISEにおける複合語同音異義語誤りの検出および訂正支援手法