連語データを利用した仮名漢字変換
スポンサーリンク
概要
- 論文の詳細を見る
仮名漢字変換における変換精度を向上させる現実的な方法として, 慣用句などの単語が固定的に共起する表現データを活用して分かち書きと同音語の曖昧性解消処理を行うことが考えられ, 商用システムなどでも試みられている.しかし, これらの表現の種別や量と変換精度向上への貢献度との関係についてはこれまで明らかにされていない.筆者らはこれらの表現を連語データとして比較的大規模に収集・整理し, 段階的に導入して仮名漢字変換精度を判定する実験を行った.実験は約23,000個の入力仮名文字列とその漢字変換正解および分かち書き正解からなる評価用データを作成して行った.その結果, 約72,000個の連語を単語の共起データとして用いる場合, 共起情報をまったく用いない仮名漢字変換システムに比べて漢字第1候補正解率で8.9%, 分かち書き正解率で4.9%向上すること, 市販の平均的なPC用ワープロソフトの漢字第1候補正解率を7.0%向上させることなどが明らかになった.
- 1998-11-15
著者
-
吉村 賢治
福岡大学工学研究科情報・制御システム工学専攻
-
首藤 公昭
福岡大学工学研究科情報・制御システム工学専攻
-
小山 泰男
セイコーエプソン
-
首藤 公昭
福岡大学工学部電子情報工学科
-
小山 泰男
福岡大学大学院工学研究科情報・制御システム工学専攻
-
安武 満佐子
福岡大学工学部電子情報工学科
関連論文
- 格助詞「に」の深層格推定 : モデル検証と固有名詞対策
- 中間言語方式による日本語述部の英訳について
- 格助詞「に」の深層格に基づく日英機械翻訳について
- 連語データを利用した仮名漢字変換
- 助述表現の意味的類似度判定
- 1CD-Linuxを用いたグリッド環境の構築と検証
- Computer Science Unpluggedの教員免許更新講習での活用事例
- 日本語科学技術文における専門用語の自動抽出システム
- Computer Science Unplugged の教員免許更新講習での活用事例
- 日本語の慣用的表現辞書について
- 日本語の慣用的表現辞書について
- 日本語文末表現の言い換え
- 日本語文末表現の取り扱いについて
- E_038 日本語文末表現の取り扱いについて(E分野:自然言語)
- キーワードの活性度の変化を用いたテキストセグメンテーション (2000年情報学シンポジウム--ネットワーク型情報メディアの活用と情報を活かす新技術) -- (セッション5:情報検索・情報抽出)
- 依存構造に基づく言語表現の意味的類似度
- 依存構造に基づく言語表現の意味的類似度
- 単文内での共起情報を用いた同音語処理
- 格助詞「に」の深層格推定 : 格助詞の意味再考(含意関係認識・解析・語彙)
- 非命題的意味解析のための日本語文末表現意味体系
- 意味構造を介した日本語文末表現の英訳
- 日本語連語候補に対する情報付与について
- 大規模MWEデータベースを組み込んだ形態素解析システム
- 非命題的意味解析のための日本語文末表現意味体系(「主観表現処理の最前線」シンポジウム)
- 日本語連語データの整備
- 日本語述部における日英翻訳システム
- 意味理解のための日本語構文解析 : 係り受け関係の表示
- 日本語文分かち書きのための新しい枠組み
- 日本語文における態の処理について--格変換と補文の抽出
- 名詞間の類似度および述語性表現の一般化
- 課題遂行時の周辺視野における色と動きの検出範囲(日本基礎心理学会第27回東北大会,大会発表要旨)
- 電子掲示板コーパス作成について
- 助述表現とその言い換え
- 日本語の複単語表現辞書 : JDMWE
- 専門分野を対象とした日英機械翻訳について
- ジェフ・ホーキンス, サンドラ・ブレイクスリー著, 伊藤文英訳, 考える脳考えるコンピューター, ランダムハウス講談社, (2005), 原著: Hawkins, J. with Blakeslee, S., On Intelligence, Times Books (2004)
- 曖昧な文節区切りに対応したかな漢字変換評価用テキストデータ
- Lebenstein距離算出のための表示プログラム
- 依存構造に基づく言語表現の意味的類似度
- 2漢字語の解析における優先順位の決定について
- 日本語形態素解析のための派生文法
- 古文の形態素解析システム
- 2漢字語の解析
- 未登録語を含む日本語文の形態素解析
- 日本語の構造とその解析 (計算言語学)
- 日本語技術文における並列構造
- 制御機構を有する表方式の形態素解析--基本アルゴリズム
- 日本語の機械処理のための並列構造の調査
- 科学技術論文表題の日中機械翻訳
- 関係表現,助述表現の類似度を考慮した言語表現間の意味的類似度判定
- 日本語処理のための固定的共起表現辞書
- 深さ優先探索とスタックの利用を学習するCSアンプラグド教材の試作
- 日本語文の係り受け構造表示プログラム
- 漸次的に単語部分木を出力する音声認識システム
- E-034 漸次的な発話理解のための単語部分木を出力する音声認識システム(E分野:自然言語・音声・音楽)