多重照合型形態素抽出方式に関する検討
スポンサーリンク
概要
- 論文の詳細を見る
形態素抽出処理は、単語辞書を検索することによって、入力されたテキストに出現した可能性のある全単語(形態素)を抽出する処理である。文章解析の最初に不可欠な処理である上に、処理時間に占める比率が大きい(形態素解析では処理時間の7割を越える)ことから、高速化が強く望まれる。本稿では、ハードウェアによる並列処理を想定した高速化方式の1つとして、テキストと単語辞書との照合の際に、抽出位置や照合対象単語を多重化することを検討し、その実現上の問題点を明らかにする。
- 一般社団法人情報処理学会の論文
- 1989-10-16
著者
-
福島 俊一
東大理
-
菊地 芳秀
日本電気株式会社システムプラットフォーム研究所
-
福島 俊一
日本電気株式会社ヒューマンメディア研究所
-
福島 俊一
Nec
-
大山 裕
日本電気株式会社 C&Cシステム研究所
-
宮井 均
日本電気株式会社 C&Cシステム研究所
-
宮井 均
日本電気株式会社 C&cシステム研究所
-
菊地 芳秀
日本電気株式会社 C&cシステム研究所
-
大山 裕
日本電気株式会社c&cシステム研究所
関連論文
- Web文書集合からの意見情報抽出と着眼点に基づく要約生成(Webマイニング)(テーマ:「Webマイニングによる情報活動と自然言語処理」その他一般)
- Web文書集合からの意見情報抽出と着眼点に基づく要約生成(Webマイニング)(テーマ:「Webマイニングによる情報活用と自然言語処理」その他一般)
- 日本語情報検索システム評価用テストコレクション BMIR-J2
- 3a-SD-6 "CAMAC AUTO-SCANNER"の設計・製作
- 中継バッファ方式の災害復旧時間短縮手法(ストレージ応用技術, SWOPP武雄2005 (2005年並列/分散/協調処理に関する「武雄」サマー・ワークショップ))
- BT-1-7 広域災害に対するストレージによるデータ保護(BT-1. 非常災害に向けた高度情報ネットワークの構成と制御, 通信2)
- 中継バッファ装置を用いた災害対策方式(2004年並列/分散/協調処理に関する「青森」サマーワークショップ(SWoPP青森2004))
- D-10-2 中継装置を用いた災害対策方式の提案
- Webページの重要度ファクタに関する一考察
- 意見抽出を目的とした機械学習による属性-評価値対同定(属性抽出)
- 仮説生成と検証の効率的組合せに基づく手書き文字列読み取り向け知識処理方式
- 転置ファイルとビット配列を用いた高速文字列あいまい照合アルゴリズム
- 認識知識処理 (認識と制御技術 特集)
- ボトムアップ/トップダウン処理を融合した手書き文字列読み取り知識処理
- 手書き文字列読み取りのための単語列探索アルゴリズム : 文字タグ法
- 手書き文字列読み取りのための単語連鎖制約に基づく効率的探索と棄却
- 効率的探索とトップダウン的検証を組み合わせた手書き住所読み取り知識処理
- 文字タグ法による手書き住所読み取りの評価
- A-4 テキストからの類義語抽出手法とその評価(概念と言語(I))
- 手書き文字列読み取りのための単語列探索アルゴリズム : 文字タグ法
- 手書き住所読取りのための町名検索アルゴリズム : 文字タグ法
- 手書き住所読取りにおけるパタン処理と連携した住所知識処理方式
- 共起類似性に基づく同義語の抽出
- D-2 Support Vector Machineを用いた地域情報ページの自動分類(Webコンテンツ処理,D.データベース)
- モバイルサーチエンジンWithAirの試作と評価
- モバイルサーチエンジンWithAirの試作と評価
- CIFSサーバ仮想化方式の設計及び評価(2003年並列/分散/協調処理に関する「松江」サマーワークショップ(SWoPP松江2003))(CPSY-5並列分散システム)
- NASスイッチ : NFSサーバの仮想化統合技術の開発
- 情報検索システム評価用ベンチマークVer.1.0(BMIR-J1)について (メディア統合および環境統合のための高機能データベースシステム、および一般)
- 日本語情報検索システムのためのベンチマークの構築
- 情報検索システム評価用データベースの構築の提案
- 意見抽出のための評価表現の収集
- インターネットからの評判情報検索(WWW上の情報の知的アクセスのためのテキスト処理)
- テキストマイニングによる評価現象の収集
- D-1 意見分析システムにおける意見抽出方式の検討と評価(Webコンテンツ処理,D.データベース)
- インターネットからの評判情報検索
- インターネットからの評判情報検索
- 冗長分散格納によるPCクラスタ上の動的負荷均衡化
- 大規模テキスト並列検索エンジンRetrievalExpress (1) : 並列検索方式
- 情報サービス端末の試作 : サービスカウンタターミナル
- 情報サービス端末の概要 : サービスカウンタターミナル
- 全文検索用文字成分表の一圧縮方式
- 文章解析アクセラレータ(2) : 接続検定マシンMONCの試作と評価
- 形態素抽出マシンMEX-IIの試作と評価
- 形態素抽出マシンMEX-IIの概要
- ア***ロセッサによる文脈自由言語の並列認識アルゴリズム
- 文章解析アクセラレータ(1) : 形態素抽出マシンの試作
- 多重照合型形態素抽出方式に関する検討
- 文字列検索LSIを用いた国語辞書システムの構築法
- 文構造を有する日本語テキストエディタJESS
- 日本語文章作成支援システムCOMET
- マンマシンインタフェースシミュレータ (INTERA/P)の操作仕様書出力機能
- 7-4 オフィス・教育への応用(7.画像技術の応用)(テレビジョン年報)
- マンマシン対話CAD(INTERA) : INTERA/Pの試作
- 辞書およびパターンマッチルールの増強と品質強化に基づく日本語固有表現抽出
- 予測ペン入力インタフェースとその手書き操作削減効果
- 大語彙かな漢字変換 : 未登録語と区切り誤りの減少
- 招待講演:新世代検索ポータル技術 (2001年情報学シンポジウム講演論文集--21世紀の情報化社会・ネットビジネスを支える情報学/情報技術) -- (セッション5:情報技術の視点から)
- 「情報検索の新たな展開 : テストコレクションからサーチエンジンまで」
- WWWサーチエンジン (特集 情報検索)
- Webサーチエンジンの基本技術と最新動向(上)基本技術
- Webサーチエンジンの基本技術と最新動向(下)最新技術
- WWW情報検索技術と評価の問題(情報検索システムの力くらべ : テストコレクションによる評価)
- 農業情報の検索・ナビゲーション (特集 情報化がもたらす新しい農業・農村)
- インタ-ネットドキュメント検索 (インタ-ネット特集) -- (期待されるインタ-ネット先進技術)
- 検索技術 (マルチメディア特集) -- (マルチメディア要素技術)
- テキストデ-タベ-ス検索 (日本語処理技術特集) -- (テキストデ-タベ-ス技術)
- 校正支援システムSt.WORDS (日本語処理技術特集) -- (ドキュメント処理技術)
- 専用ハードウェアを用いた形態素解析器の開発
- 形態素抽出ハードウェアアルゴリズムとその実現
- 検索エンジンの仕組みと技術の発展(インターネット検索エンジン)
- モバイルユーザ向け情報選別配信技術
- 目的および個人に特化したサーチエンジンの開発 (「Webシステムにおける情報獲得支援技術」)
- 4P-9 組合せ情報フィルタ方式の信頼度を用いた精度改良
- 4T-02 文書タイプ分類による問題解決のためのWWW検索システム
- 4T-2 文書タイプ分類による問題解決のためのWWW検索システム
- 文書タイプ分類による問題解決向きWWW検索システムの開発と評価
- インターネット多角的検索システムOTROS : 構造的特徴量によるタイプ分類と検索
- 日本語全文検索における文字組ベースのランキングの評価
- 大語彙辞書を用いたかな漢字変換についての考察
- ヒューマンインタフェース
- 大語彙かな漢字変換 : 連語の効果について
- マーク付けテキストを対象とした文章検査
- 大語彙かな漢字変換 : 日本語テキストによる文章解析評価