未登録語を含む日本語文の形態素解析
スポンサーリンク
概要
- 論文の詳細を見る
実用的な日本語文解析システムにおいて,入力文中に存在する未登録語の位置や文法情報等の推定は不可欠な処理である.日本語文の解析手順は,形態素解析,構文解析,意味解析などの各解析を段階的に行うものと,これらを融合的に行うものとに大きく分類できる.本論文では前者の方式を想定し,形態素解析の段階における未登録語の処理について述べる.本論文で示す形態素解析アルゴリズムは基本的に解析表を利用した横型探索のアルゴリズムであり,入力文中の一文字の漢字,平仮名や英字列,片仮名列を自立語と同等に扱うことにより未登録語の処理を可能にしている.このとき入力文の一文字ごとに自立語辞書を検索するという効率の問題やシステムにとっては正しいが本質的には誤っている膨大な数の解析が発生するという尤度評価の問題が生じる.これに対して本アルゴリズムでは,字種情報に基づいた文節末の可能性と解析の単位に対するコストの付与という二つのヒューリスティック情報を利用している.アルゴリズムの能率は入力文の文字数nに対して時間計算量,領域計算量ともにO(n)である.また,このアルゴリズムにより入力文中の未登録語の90.9%を正しく処理できることを実験により確認した.
- 一般社団法人情報処理学会の論文
- 1989-03-15
著者
-
吉村 賢治
福岡大学工学研究科情報・制御システム工学専攻
-
首藤 公昭
福岡大学工学研究科情報・制御システム工学専攻
-
武内 美津乃
福岡大学工学部電子工学科
-
首藤 公昭
福岡大学工学部電子情報工学科
-
津田 健蔵
福岡大学工学部電子工学科
関連論文
- 格助詞「に」の深層格推定 : モデル検証と固有名詞対策
- 中間言語方式による日本語述部の英訳について
- 格助詞「に」の深層格に基づく日英機械翻訳について
- 連語データを利用した仮名漢字変換
- 助述表現の意味的類似度判定
- 1CD-Linuxを用いたグリッド環境の構築と検証
- Computer Science Unpluggedの教員免許更新講習での活用事例
- 日本語科学技術文における専門用語の自動抽出システム
- Computer Science Unplugged の教員免許更新講習での活用事例
- 日本語の慣用的表現辞書について
- 日本語の慣用的表現辞書について
- 日本語文末表現の言い換え
- 日本語文末表現の取り扱いについて
- E_038 日本語文末表現の取り扱いについて(E分野:自然言語)
- キーワードの活性度の変化を用いたテキストセグメンテーション (2000年情報学シンポジウム--ネットワーク型情報メディアの活用と情報を活かす新技術) -- (セッション5:情報検索・情報抽出)
- 依存構造に基づく言語表現の意味的類似度
- 依存構造に基づく言語表現の意味的類似度
- 単文内での共起情報を用いた同音語処理
- 格助詞「に」の深層格推定 : 格助詞の意味再考(含意関係認識・解析・語彙)
- 非命題的意味解析のための日本語文末表現意味体系
- 意味構造を介した日本語文末表現の英訳
- 日本語連語候補に対する情報付与について
- 大規模MWEデータベースを組み込んだ形態素解析システム
- 非命題的意味解析のための日本語文末表現意味体系(「主観表現処理の最前線」シンポジウム)
- 日本語連語データの整備
- 日本語述部における日英翻訳システム
- 意味理解のための日本語構文解析 : 係り受け関係の表示
- 日本語文分かち書きのための新しい枠組み
- 日本語文における態の処理について--格変換と補文の抽出
- 名詞間の類似度および述語性表現の一般化
- 課題遂行時の周辺視野における色と動きの検出範囲(日本基礎心理学会第27回東北大会,大会発表要旨)
- 電子掲示板コーパス作成について
- 助述表現とその言い換え
- 日本語の複単語表現辞書 : JDMWE
- 専門分野を対象とした日英機械翻訳について
- ジェフ・ホーキンス, サンドラ・ブレイクスリー著, 伊藤文英訳, 考える脳考えるコンピューター, ランダムハウス講談社, (2005), 原著: Hawkins, J. with Blakeslee, S., On Intelligence, Times Books (2004)
- 曖昧な文節区切りに対応したかな漢字変換評価用テキストデータ
- Lebenstein距離算出のための表示プログラム
- 依存構造に基づく言語表現の意味的類似度
- 2漢字語の解析における優先順位の決定について
- 日本語形態素解析のための派生文法
- 古文の形態素解析システム
- 2漢字語の解析
- 未登録語を含む日本語文の形態素解析
- 日本語の構造とその解析 (計算言語学)
- 日本語技術文における並列構造
- 制御機構を有する表方式の形態素解析--基本アルゴリズム
- 日本語の機械処理のための並列構造の調査
- 科学技術論文表題の日中機械翻訳
- 関係表現,助述表現の類似度を考慮した言語表現間の意味的類似度判定
- 日本語処理のための固定的共起表現辞書
- 深さ優先探索とスタックの利用を学習するCSアンプラグド教材の試作
- 日本語文の係り受け構造表示プログラム
- 日本語技術文に対する自動分かち書き実験--大規模辞書を用いない試み
- 意味理解を目的とした日本語の構文解析アルゴリズム
- 漸次的に単語部分木を出力する音声認識システム
- E-034 漸次的な発話理解のための単語部分木を出力する音声認識システム(E分野:自然言語・音声・音楽)