原表記とカナ表記の対応判定アルゴリズム
スポンサーリンク
概要
- 論文の詳細を見る
日本語のカナ等の音標文字を使って外来語を表記する場合、複数の表記のしかたが存在することが多い。例えば"interview"の表記には、"interview",「インタビュ」,「インタヴュ」,「インタビュー」,「インタヴュー」等がある。これらの表記結果同士が同一語を表わしているかどうかの判定が求められている場として、文書校正システムの表記ばらつき検出や情報検索システムがある。従来は、これらの表記を辞書に登録する方式がとられたが、辞書の作成・保守が大きな問題であった。ここでは、辞書を使わずに、発音をもとにして表記の対応を判定するアルゴリズムについて、カナ表記-英語表記の対応判定システムを例に説明する。
- 1988-09-12