形態素抽出ハードウェアアルゴリズムとその実現
スポンサーリンク
概要
- 論文の詳細を見る
本稿では,形態素抽出の新しいハ-ドウェアアルゴリズムを提案する.形態素抽出処理は,単語辞書を検索することによって,入力されたテキストに出現したと思われる単語(形態素)をすべて抽出する処理である.自然言語解析に不可欠であり,かつ,時間のかかる処理であることから,高速化が強く望まれていた.提案するハードウェアアルゴリズムは,基本的な1回の照合サイクルをできる限り短縮する方針で設計し,(1)シフトレジスタによるテキストの順送り,(2)先頭文字による辞書範囲の絞り込み制御,(3)単語を構成する全文字の同時照合など,ワイヤードロジックとして容易に実現できる手法を組み合わせたものである.本アルゴリズムを実行する専用ハードウェア(形態素抽出マシンMEX-I)を試作し,8万語の単語辞書を用いた形態素抽出処理を,テキスト1万文字当たり約1秒で実行できるアルゴリズムの高速性を確認した.この処理速度は,パーソナルコンピュータ(CPU:80386,クロック:16MHz)上のソフトウェアと比較して,100倍〜1000倍高速である.さらに,テキストの各文字がM個の候補をもつ場合の処理時間が,従来のソフトウェアアルゴリズムではMの累乗オーダになるのに対して,本アルゴリズムはMの線形オーダに抑えられる優位性をもつ.
- 一般社団法人情報処理学会の論文
- 1991-10-15
著者
関連論文
- Web文書集合からの意見情報抽出と着眼点に基づく要約生成(Webマイニング)(テーマ:「Webマイニングによる情報活動と自然言語処理」その他一般)
- Web文書集合からの意見情報抽出と着眼点に基づく要約生成(Webマイニング)(テーマ:「Webマイニングによる情報活用と自然言語処理」その他一般)
- 3a-SD-6 "CAMAC AUTO-SCANNER"の設計・製作
- Webページの重要度ファクタに関する一考察
- 意見抽出を目的とした機械学習による属性-評価値対同定(属性抽出)
- 口語的表現を含む日本語文の形態素解析の実現と評価
- D-2 Support Vector Machineを用いた地域情報ページの自動分類(Webコンテンツ処理,D.データベース)
- モバイルサーチエンジンWithAirの試作と評価
- モバイルサーチエンジンWithAirの試作と評価
- 情報検索システム評価用ベンチマークVer.1.0(BMIR-J1)について (メディア統合および環境統合のための高機能データベースシステム、および一般)
- 日本語情報検索システムのためのベンチマークの構築
- 意見抽出のための評価表現の収集
- インターネットからの評判情報検索(WWW上の情報の知的アクセスのためのテキスト処理)
- テキストマイニングによる評価現象の収集
- D-1 意見分析システムにおける意見抽出方式の検討と評価(Webコンテンツ処理,D.データベース)
- インターネットからの評判情報検索
- インターネットからの評判情報検索
- 冗長分散格納によるPCクラスタ上の動的負荷均衡化
- 文章解析アクセラレータ(1) : 形態素抽出マシンの試作
- 多重照合型形態素抽出方式に関する検討
- 1N-3 日本語テキストからの固有表現抽出システムの開発と評価
- 1U-3 テキスト中の数値表現を用いた情報検索方式の評価
- 招待講演:新世代検索ポータル技術 (2001年情報学シンポジウム講演論文集--21世紀の情報化社会・ネットビジネスを支える情報学/情報技術) -- (セッション5:情報技術の視点から)
- WWWサーチエンジン (特集 情報検索)
- Webサーチエンジンの基本技術と最新動向(上)基本技術
- Webサーチエンジンの基本技術と最新動向(下)最新技術
- WWW情報検索技術と評価の問題(情報検索システムの力くらべ : テストコレクションによる評価)
- 農業情報の検索・ナビゲーション (特集 情報化がもたらす新しい農業・農村)
- インタ-ネットドキュメント検索 (インタ-ネット特集) -- (期待されるインタ-ネット先進技術)
- 検索技術 (マルチメディア特集) -- (マルチメディア要素技術)
- テキストデ-タベ-ス検索 (日本語処理技術特集) -- (テキストデ-タベ-ス技術)
- 校正支援システムSt.WORDS (日本語処理技術特集) -- (ドキュメント処理技術)
- 専用ハードウェアを用いた形態素解析器の開発
- 形態素抽出ハードウェアアルゴリズムとその実現
- 検索エンジンの仕組みと技術の発展(インターネット検索エンジン)
- モバイルユーザ向け情報選別配信技術
- 目的および個人に特化したサーチエンジンの開発 (「Webシステムにおける情報獲得支援技術」)
- 4P-9 組合せ情報フィルタ方式の信頼度を用いた精度改良
- 4T-02 文書タイプ分類による問題解決のためのWWW検索システム
- 4T-2 文書タイプ分類による問題解決のためのWWW検索システム
- 文書タイプ分類による問題解決向きWWW検索システムの開発と評価
- インターネット多角的検索システムOTROS : 構造的特徴量によるタイプ分類と検索
- 日本語全文検索における文字組ベースのランキングの評価