言語データベース作成のための形態素解析における未知語検出の検討
スポンサーリンク
概要
- 論文の詳細を見る
現在我々は大規模な言語データベースの構築を行なおうとしている。データベース作成にあたっては大量のテキストを解析することが必要であり、これらのテキストを対して十分な語彙を持つ辞書を用意する必要がある。しかしながらあらゆるテキストに対処できる辞書を構成することは日本語の造語能力などの点から、因難である。またデータベース作成の趣旨からはテキスト中に辞書に記載されていない語が存在した場合この語の文法的性質や意味推定を行ない、最終的には新語として辞書に単語登録する段階に達することが望まれる。本稿ではデータベース作成の第一段階として行なわれる形態素解析において辞書未登録語を検出することを目的とする。従来さまざまな形態素解析法が提案されているがこれらは解析対象となるテキストに辞書未登録語が現れないことを前提としているものが多く、未登録語が存在する場合の動作は保証されていない。ここでは一旦形態素候補を作成した後、新たな形態素候補を加えることにより、未知語が存在しても形態素解析が行なえるアルゴリズムを開発することをねらう。
- 1992-02-24
著者
関連論文
- ホルマントを用いた中国語単母音の分析と認識
- 言語データベース作成のための形態素解析における未知語検出の検討
- 紙上記録波形の計算機入力システムの評価
- 多チャネル波形画像からの単チャネル波形画像の切り出しと細線化
- 東北大-松下単語音声データベース (<小特集>出揃った音声データベース)
- 音素・文字間の遷移情報を用いた単語認識の性能予測
- 音響ディジタル信号処理を主目的とする高速演算装置μKIDOCH
- 日本語教育支援システムにおける教師・生徒発声音比較の時間軸の非線形伸縮による自動化
- 活字デーヴァナーガリ文字認識における少数サンプル辞書画像の推定
- 切り出しと認識を同時に行なう文字認識法 : 活字デーヴァナーガリ文字を例として
- 音声情報の自動獲得機能を持つ分散型大規模音声データベース「K-DB」
- 単語中母音の聴取実験結果と認識実験結果の比較
- ローカルピークによる語中母音の認識率改善の一方法
- 母音認識におけるスペクトルの2値化の一方法
- スペクトルの時間変化, ローカル・ピーク, 傾斜を利用した破裂子音の検出と認識の検討
- VLIW型計算機KIDOCHのメモリ管理機構について
- 文節間文法を用いた未知語検出
- 文節オートマトンを用いた未知語検出法
- テーパ窓を用いた特異値分解と極推定による1次元空間上の複数音源の位置推定
- マルチパルス駆動自己回帰過程からの全極型伝達関数と駆動パルス列の同時推定法