SIMD型並列プロセッサを用いたフルテキスト検索 (<特集>並列処理)
スポンサーリンク
概要
- 論文の詳細を見る
文書データの効率的な運用を目指し,これまで文書画像処理や文字認識処理エンジンとして利用してきた小型並列プロセッサ(LISCAR)上に,高速のフルテキスト検索機能を実現した.LISCARは1ビットのプロセッサエレメント(PE)を64個搭載したAAP2-LS14個からなる256並列のSIMD型2次元ア***ロセッサである.検索システムは,このLISCAR とホストコンピュータ(パソコン)で構成しており,あらかじめパソコンから検索プログラムと文書データとをロードしておき,必要に応じて検索単語と検索条件とを入力することで検索を実現している.LISCARによるフルテキスト検索としては,文書データの水平格納によるピットシリアル型の処理方式を中心に検討した.実験では日本語文書データを用い検索処理の基本となる完全一致と部分一致の検索速度を評価した.その結果,完全一致検索では,(1)全文字照合(総当たり照合)の速度は文書データ量と検索単語の語長に比例し,4文字単語では2.2千万字/秒,(3)絞り込み照合(不一致後は次の文字列に移る照合)の速度は検索単語の語長にはほとんど依存せず,文書データ量に比例し,出現頻度の高い4文字単語の検索例では実効4千万字/秒程度になることがわかった.さらに,部分一致検索では異字許容照合や単語内ワイルドカード照合が,それぞれ全文字照合や絞り込み照合とほぼ同程度の速度で検索できることを示した.
- 一般社団法人情報処理学会の論文
- 1992-03-15
著者
-
宮原 末治
Nttヒューマンインタフェース研究所
-
宮原 末治
Nttヒューマンインタフェース研究所マルチメディア処理研究部
-
近藤 利夫
Nttlsi研究所
-
近藤 利夫
Nttヒューマンインタフェース研究所マルチメディア処理研究部
-
多田 俊吉
NTTインテリジェントテクノロジー(株)
関連論文
- 動き補償における探索領域の移動制御に関する一考察
- 単フィールド動きベクトル探索法
- 単語認識系における遺伝アルゴリズムを用いたキー文字選択の最適化
- マルチメディア端末用手書き入力インタフェースの設計とその応用
- オンライン文字認識による手書き入力ソフトウェア (特集 文字認識応用システム)
- ストロ-ク対応付けによるオンライン手書き漢字認識 (特集 文字認識応用システム)
- テレコンサルティングシステム (マルチメディアISDN端末の開発)
- SIMD型並列プロセッサを用いたフルテキスト検索 (並列処理)
- SIMD型並列プロセッサを用いたフルテキスト検索
- 小形高並列プロセッサとその文字認識への応用 (並列処理ハ-ドウェアと言語特集)
- 低品質文字の認識における単語照合の精度推定法
- ストローク単位のアフィン変換を用いたオンライン手書き漢字認識
- パターン間照合を利用した文字認識結果の確認修正法
- 文字位置のずれを許容する枠なし筆記住所認識
- 日本語OCRにおける認識結果の一括修正
- 未登録語の出現を考慮した単語認識
- 文字連接を用いたフルテキスト検索の高速化
- 用途別シソーラス構築法の検討
- 手書き文字認識の適応型後処理制御
- 文書情報蓄積検索システムの検討
- 係り受け関係を用いた類似文書検索システム
- 情報検索用シソーラスの試み
- 手書き住所認識の後処理法
- 文字列抽出型周辺分布法による文書の傾き検出
- 複数手法における候補カテゴリーの識別値を統合処理する神経回路により手書き漢字認識
- 統合神経回路を用いた手書き漢字認識
- 1次元SIMDプロセッサ向きデータアクセス機構
- ニュ-ロセッサ--ニュ-ロ処理指向並列プロセッサ (ニュ-ラルネット情報処理技術)
- 2次元アレ-プロセッサ(AAP2)とプログラミング言語 (並列処理ハ-ドウェアと言語特集)
- 小形並列プロセッサLISCARの構成
- LISCARを用いた印刷文書読取り