最長共通部分文字列探索を用いたテキストからの仮名漢字変換候補単語の抽出方法
スポンサーリンク
概要
- 論文の詳細を見る
本論文は, 与えられた漢字仮名混じり文とその読み仮名文字列を対象とし, この2つの文字列相互間の対応関係を同定する文字列照合方法を提案し, 日本語のテキストから仮名漢字変換候補単語を抽出する方法について検討する. すなわち, 形態素解析処理を行わずにテキストから漢字表記とその読みのペアを抽出する方法について述べる. この抽出されたペアを仮名漢字変換候補単語と呼ぶ. 文字列照合における問題点は, 漢字表記の読みの中に平仮名で表記される語と同じ読みが存在する場合に対応関係が多対多になり,ー意に決定できずに誤った対応関係が抽出されてしまうという点である. この問題に対する従来の方法は, 前方と後方から文字列照合を行い, 対応関係が双方で一致したペアだけを抽出する双方向解析を導入し, 抽出されなかったペアについては, 曖昧さの生じない他の例文から抽出されるとするものであった. しかし, 他の例文から抽出される可能性は否定できないが, 抽出されない可能性も否定でさず, 他の例文に依存せずに抽出する方法を検討する必要性は大きい. 本提案手法は, 2つの文字列間の最長共通部分文字列探索の手法を導入し, 対象文字列間の表層的な特徴に基づく制約条件と単漢字変換辞書を用いて, 決定論的に対応関係を同定し, 仮名漢字変換候補単語を抽出する. 新聞記事の見出し300文を対象に実験を行った結果, 100%の抽出成功率を得た.
- 一般社団法人情報処理学会の論文
- 1996-05-28
著者
関連論文
- 手指動作記述文を利用した手話単語のパターン認識と理解 : 言語と画像の接点
- 手指動作記述文間の類似性に基づく手話単語の検索方法
- 手指動作記述文間の類似性に基づく手話単語の分類方法
- 手指動作記述文間の類似性に基づく類似の動作特徴を含む手話単語対の抽出方法
- 手指動作記述文間の類似度計算に基づく手話単語の分類
- 手指動作特徴系列を用いた手話単語の類似検索システム
- 例文に基づく助詞欠落文の復元方法
- WWW環境での手話単語の検索システムの構築方法
- 手指動作記述文を用いた日米手話言語間の類似動作単語対の抽出方法
- 最長共通部分文字列探索を用いたテキストからの仮名漢字変換候補単語の抽出方法
- 最長共通部分文字列探索を用いたテキストからの仮名漢字変換候補単語の抽出方法
- 類推に基づく料理定義文の自動獲得
- オンラインマニュアル概要文を利用した異機種間の類似コマンド検索方法
- 手指動作記述文を利用した手話単語のパターン認識と理解
- マニュアル概要例文間のファジー関係に基づく英日機械翻訳エンジン jfreshman (Japanese version of Fuzzy REtrival SHell for a command MAN)
- 多機種間のマニュアル概要検索のためのファジー検索拡張シェルfreshman(Fuzzy Retrival Extended SHell for a command MAN)
- 手指動作記述文を利用した手話単語の類似検索方式
- 手指動作記述文を利用した手話単語間の類似関係の抽出方式 : 最長共通部分文字列探索(LCS)を基本尺度に
- 日本語・手話電子化辞書の構成法について