自立語辞書依存の少ない日本語文の形態素解析
スポンサーリンク
概要
- 論文の詳細を見る
日本語の形態素解析は、漢字かな交りで書かれた日本語文書を単語に分割すると同時に、分割された単語や形態素にそれらの品詞や形態素の役割情報を付与することである。この処理は、文献検索システムの自動キーワード抽出のような分割した単語を直接利用するタイプの応用だけでなく、日本語構文解析プログラムの前処理としても重要な働きを果し、その精度の向上は日本語解析に大きく寄与する。しかしながら、精度を高めるには従来の品詞分類に基づく語や形態素の接続条件による解析だけでは限界があるため、その他のヒューリスティックな規則を利用する必要があり、こうした規則を経験によりどれだけ集めるかが精度に大きく影響する。従来の研究では、こうした規則はアルゴリズムと一体になってシステム中に組み込まれたり、辞書中に個別の規則としで記述されたりしており、試行錯誤による規則の積上げが難しい。本発表ではこれらヒューリスティックな規則をその性質により5つの範ちゅうに分け、それぞれの規則に対応するアルゴリズムを用意することで、柔軟なシステムを実現した。
- 一般社団法人情報処理学会の論文
- 1988-09-12
著者
-
諸橋 正幸
日本アイ・ビー・エム(株)東京サイエンティフィック・センター
-
梅田 茂樹
日本アイ・ビー・エム サイエンス インスチテュート
-
諸橋 正幸
日本アイ・ビー・エム株式会社東京基礎研究所
-
梅田 茂樹
日本アイ・ビー・エム(株) 東京基礎研究所
-
諸橋 正幸
日本アイ・ビー・エム(株)サイエンス・インスティチュート
関連論文
- データベース照会システム「ヤチマタ」と名詞句データ模型
- 電気工学分野と周辺諸分野との関連度の分析 : ディスクリプタの出現頻度に基づいて
- 情報検索システムにおける効果的なナビゲーション機能の提案
- 電子図書館IV : ナビゲーションシステムプロトタイプ
- 電子図書館III : Information Outlining : 触ってわかる情報の輪郭
- 電子図書館II : 基本設計
- 電子図書館I : 将来像
- 抄録からのキーワードの自動抽出
- 抄録からのキーワードの自動抽出
- 抄録からの主題文の自動抽出
- 構文情報を用いたキーワード抽出
- 実験計画法を用いたシミュレーションによる生産工程の性能解析 : 生産システムシミュレーションに関する研究(IV)(シミュレーション)
- 生産工程シミュレーションにおける要因計画法の適用 : 生産システム・シミュレーションに関する研究(III)(シミュレーション)
- 製造工程を対象にしたシミュレーション・システム(II) : シミュレーション・システムの適用
- 製造工程を対象にしたシミュレーション・システム(I) : シミュレーション・システムの概要
- 情報処理専門教育について 大学等における情報系専門教育の改善への提言
- JSIAIワークステーション(4) : 日本語ユーザモニター
- 「ことだま」文書処理システムの文節わかち書き仮名漢字変換
- テキストマイニング : 膨大な文書データからの知識獲得 : 概要
- テキストマイニング : 膨大な文書データからの知識獲得 : 意図の認識
- 異種データに対する統合的情報検索
- Information Outlining : 検索情報の可視化 行政情報の活用のために
- 自立語辞書依存の少ない日本語文の形態素解析
- 生産指示機能をもつ生産システム・シミュレータ(CIM要素技術の最前線)
- 生産指示機能をもつ生産システム・シミュレータ(CIMとその要素技術-現状と課題-)
- 自動索引付け研究の動向
- 漢字の出現頻度特性を用いた日本語文献の機械処理