日本語文音声出力からの読み情報を用いた漢字かな混じり文 : 節候補の絞り込み
スポンサーリンク
概要
- 論文の詳細を見る
これまでに文節切りされたべた書き音節表記文節から,音節漢字変換によって得られる漢字かな交じり文節候補を,文節内及び文節間の漢字かな文字及び品詞情報のマルコフ連鎖モデルを用いて絞り込む方法が提案されて,その有効性が示されている.しかしこれらの漢字かな交じり候補の中には,日本語として意味のある正しい漢字かな交じり文節でない候補も含まれており,文節候補を組み合わせて文候補を生成する場合には無意味な文候補が大量に生成されることになり,その分処理時間が増加することになる.本論文では,このような日本語として意味の通らない間違った漢字かな混じり文節候補を取り除くために,それが日本語として意味のある正しい漢字かな混じり文字列かどうかを,高精度な読み情報を付与する日本語文音声出力システムを用いて検定する方法,すなわちその読みがもとの音節列(かな列)に一致するか否かを調べる方法を提案し,その有効性を定量的に調べた.実際に,43万語単語辞書を参照して,新聞記事77日分の統計データを用いた実験を行った結果,次のような知見を得た.1.文節内の漢字かな文字のマルコフ連鎖モデルにより得られた,10位内の漢字かな混じり候補に対して,その読み情報がもとの正解候補の音節列(かな列)と一致しないものを,間違った候補として取り除く方法により,10位内の累積正解率は平均として上位4位までの候補で,また品詞情報と併用することにより上位3位までの候補で得られることがわかった.2.文節内および文節外の漢字かな文字のマルコフ連鎖モデルにより得られた,10位内の漢字かな混じり候補に対して,上記の読み情報に基づく検定を施した場合には,標本外データの場合で第一位正解率が検定をしない場合に比べて4%高い,89.4%の正解率が得られることがわかった.3.10位内に含まれる漢字かな混じり候補のうち,読みが一致している候補は,正解候補か,または意味が同じで単に表記法だけが異なるもの,同音意義語,そして日本語として存在しないものであることがわかった.
- 1994-07-21
著者
-
荒木 哲郎
福井大学工学部知能システム工学科
-
池原 悟
NTTコミュニケーション科学研究所
-
真田 陽一
真興工業有限会社
-
横川 秀人
(株)トヨタテクノサービス
-
荒木 哲郎
福井大学 工学部
-
真田 陽一
福井大学
-
横川 秀人
福井大学
関連論文
- DBから抽出した日英新聞記事の自動対応付け
- 広域直接翻訳における品詞変換処理
- 大規模日本語コーパスからの連鎖型および離散型の共起表現の自動抽出法
- 大規模日本語コーパスからの連鎖型および離散型共起表現の自動抽出法
- 日英機械翻訳における原文自動書き替え型翻訳方式とその効果
- 専門分野対応の日英機械翻訳用構文意味辞書の構築
- 日英機械翻訳に必要な結合価パターン対の数とその収集方法
- IPAL動詞辞書との対比による日英翻訳用構文意味辞書の充足性の検討
- 2重, 3重のマルコフ連鎖モデルを2段階に使用したべた書き仮名文の文節境界推定法
- 音節連鎖特性に着目した対話文の言い直し表現の抽出法
- 音節連鎖特性に着目した対話文の言い直し表現の抽出法
- マルコフモデルによる言い直し対象の文字列の検出について
- FAXを入出力に用いた翻訳通信システムの検討
- 読みの情報を用いた仮名漢字変換の精度向上効果の推定
- マルコフモデルを用いて漢字かな混じり文候補を選択する方法
- 日本語文音声出力からの読み情報を用いた漢字かな混じり文 : 節候補の絞り込み
- 品詞ならびに漢字かな文字のマルコフ連鎖確率情報を用いた文節漢字かな列候補の絞り込み法
- マルコフ連鎖モデルによる文節かな漢字変換候補の絞り込み方法
- 和語動詞に対する日英対訳用例文の収集について
- マルコフ連鎖モデルを用いた日本語文の置換型, 挿入型及び脱落型誤りの検出・訂正法の改善
- スキップタイプのマルコフ連鎖モデルを用いた日本語文の脱落誤り文字列の検出と訂正法
- マルコフ連鎖モデルを用いた日本語文誤り検出法の改善
- m重マルコフ連鎖モデルを用いた日本語の誤字・脱落・誤挿入誤り文字列の検出と訂正法
- スキップマルコフ連鎖モデルを用いた日本文の誤り検出、訂正方法
- スキップマルコフ連鎖モデルを用いた日本文の誤り検出、訂正方法
- 音声対話文に含まれる離散的な言い直し表現の抽出法
- 単語辞書引きを用いたべた書きかな文の仮文節境界の補正方法
- 日本語文の複合誤り文字列の検出訂正法
- N-gramを用いた対話文の言い直し表現の検出法
- 日本語文の相互干渉誤り文字列の検出・訂正方法
- N-gramを用いた対話文の言い直し表現の検出法
- 2重マルコフモデルを用いたべた書きかな文の仮文節境界の推定方法
- 単語マルコフモデルを組み合わせた仮文節境界の補正法
- 文の先頭・末尾位置を考慮したべた書き日本語文の検出・訂正効果
- 新聞記事日本文における書き替え対象表現の分布
- 階層的認識構造に着目した日本語従属節間の係り受け解析の方法とその精度
- 階層的認識構造に着目した日本語従属節間の係り受け解析の方法とその精度
- 双対オートマトンに基づいた適合性試験の誤りシーケンスの実現手順
- マルコフモデルによる音節文ラテイスからのキーワード候補の絞り込み
- 3重マルコフモデルによるべた書きかな文の仮文節境界の推定法
- マルコフモデルを用いたOCRからの誤り文字列の訂正効果
- 置換誤りを含んだべた書きかな文の仮文節境界の推定方法
- アクセント位置情報を用いた文節単位の音節候補列の絞り込み効果
- 音節マルコフモデルによる日本語音節会話文ラテイスからのキーワード抽出法
- 置換誤りを含んだべた書きかな文の仮文節境界の推定法
- マルコフ連鎖モデルによるかな文と英語文の誤り訂正
- マルコフ連鎖モデルによる日本語文と英語文の誤り検出評価
- べた書きかな文の仮文節境界の補正方法
- べた書きかな文の仮文節境界の補正方法
- m重マルコフモデルによる日本語の誤字、脱落及び挿入誤りの検出法
- 2重マルコフモデルによる日本語文の誤り検出並びに訂正法
- 順方向、逆方向並びに中間タイプの2重マルコフ連鎖モデルによる日本語の誤字訂正候補選択の効果
- 2重マルコフモデルの全域法と局所法による日本語の誤字訂正効果
- 音節テラィスに適用するビタービアルゴリズムの評価について
- 日本文音節入力に対して2重マルコフ連鎖モデルを用いた漢字仮名交じり文節候補の抽出精度
- m重マルコフモデルを用いた音節ラティスからの候補絞り込み手法について
- 2重音節マルコフモデルによる日本語の文節音節認識候補の曖昧さの解消効果
- 日本文校正支援システムにおける評価方法の考察
- 2重マルコフ音節連鎖確率を用いた日本語音声認識後処理
- 弱抑制による連鎖共起表現の抽出とそれに基づく離散共起表現の抽出
- 対訳コーパスから対応する表現対の自動抽出
- 語用論的・意味論的制約を用いた日本語ゼロ代名詞の文内照応解析
- 語用論的・意味論的制約を用いた日本語ゼロ代名詞の文内照応解析
- 多段解析法による日本語形態素解析の精度
- 日英機械翻訳における利用者登録語の意味属性の自動推定
- 日英機械翻訳における利用者登録語の意味属性の自動推定
- 言語表現体系の違いに着目した日英機械翻訳機能試験項目の構成
- 日本語従属節の依存構造に着目した係り受け解析
- 用言意味属性を用いた日本語ゼロ代名詞の文章外照応解析
- 単語解析プログラムによる日本文誤字の自動検出と二次マルコフモデルによる訂正候補の抽出
- 機械翻訳の現状 : 日英及びその他の言語 (コンピュータ・コミュニケーションの現在)
- 近接単語の並びに着目した形態素解析多義の絞り込み
- 日本文書き替え処理における制御ルールの類型情報の抽出
- 日英機械翻訳における原文前編集の内容と効果について