単文内での共起情報を用いた同音語処理
スポンサーリンク
概要
- 論文の詳細を見る
仮名漢字変換において,同音語に起因する複数の変換候補から正しい候補を選択する方法として,単文内で格関係を持つ名詞と動詞の共起情報を利用する方法を提案する.本方式で用いる名詞と動詞間の共起情報はコーパスから比較的容易に収集可能であることからシステムの実現性も高く,従来用いられてきた動詞の意味的選択制限を利用する方法と異なり,動詞の入力を待たずに変換を行うことができるという特徴を持つ.本方式による変換実験を1,129文の単文に対して行った結果,14.7%の文について変換候補の優先順位を決定でき,それらの文については81.9%の文で第一候補に正解を得ることができた.入力単文中の動詞が名詞候補と共起しうる動詞の集合に含まれていなければならないという制約を取り除いて,名詞の変換のみを行った場合には,93.3%の文について変換候補の優先順位を決定でき,それらの63.0%で第一候補に正解を得ることができた.単語の使用頻度に基づく同音語処理方式との比較を行った結果,本方式の正解率が文単位で40.3%上回っており,本方式の有効性を確認できた.
- 一般社団法人情報処理学会の論文
- 1996-06-15
著者
-
吉村 賢治
福岡大学工学研究科情報・制御システム工学専攻
-
首藤 公昭
福岡大学工学研究科情報・制御システム工学専攻
-
高橋 雅仁
久留米工業大学
-
高橋 雅仁
福岡大学工学部電子情報工学科
-
首藤 公昭
福岡大学工学部電子情報工学科
関連論文
- 格助詞「に」の深層格推定 : モデル検証と固有名詞対策
- 中間言語方式による日本語述部の英訳について
- 格助詞「に」の深層格に基づく日英機械翻訳について
- 連語データを利用した仮名漢字変換
- 助述表現の意味的類似度判定
- 1CD-Linuxを用いたグリッド環境の構築と検証
- Computer Science Unpluggedの教員免許更新講習での活用事例
- 日本語科学技術文における専門用語の自動抽出システム
- Computer Science Unplugged の教員免許更新講習での活用事例
- 日本語の慣用的表現辞書について
- 日本語の慣用的表現辞書について
- 日本語文末表現の言い換え
- 日本語文末表現の取り扱いについて
- E_038 日本語文末表現の取り扱いについて(E分野:自然言語)
- キーワードの活性度の変化を用いたテキストセグメンテーション (2000年情報学シンポジウム--ネットワーク型情報メディアの活用と情報を活かす新技術) -- (セッション5:情報検索・情報抽出)
- 依存構造に基づく言語表現の意味的類似度
- 依存構造に基づく言語表現の意味的類似度
- 単文内での共起情報を用いた同音語処理
- 格助詞「に」の深層格推定 : 格助詞の意味再考(含意関係認識・解析・語彙)
- 非命題的意味解析のための日本語文末表現意味体系
- 意味構造を介した日本語文末表現の英訳
- 日本語連語候補に対する情報付与について
- 大規模MWEデータベースを組み込んだ形態素解析システム
- 非命題的意味解析のための日本語文末表現意味体系(「主観表現処理の最前線」シンポジウム)
- 日本語連語データの整備
- 日本語述部における日英翻訳システム
- 意味理解のための日本語構文解析 : 係り受け関係の表示
- 日本語文分かち書きのための新しい枠組み
- 日本語文における態の処理について--格変換と補文の抽出
- 名詞間の類似度および述語性表現の一般化
- 課題遂行時の周辺視野における色と動きの検出範囲(日本基礎心理学会第27回東北大会,大会発表要旨)
- 電子掲示板コーパス作成について
- 助述表現とその言い換え
- 日本語の複単語表現辞書 : JDMWE
- 専門分野を対象とした日英機械翻訳について
- ジェフ・ホーキンス, サンドラ・ブレイクスリー著, 伊藤文英訳, 考える脳考えるコンピューター, ランダムハウス講談社, (2005), 原著: Hawkins, J. with Blakeslee, S., On Intelligence, Times Books (2004)
- 曖昧な文節区切りに対応したかな漢字変換評価用テキストデータ
- Lebenstein距離算出のための表示プログラム
- 依存構造に基づく言語表現の意味的類似度
- 2漢字語の解析における優先順位の決定について
- 日本語形態素解析のための派生文法
- 古文の形態素解析システム
- 2漢字語の解析
- 未登録語を含む日本語文の形態素解析
- 日本語の構造とその解析 (計算言語学)
- 日本語技術文における並列構造
- 制御機構を有する表方式の形態素解析--基本アルゴリズム
- 日本語の機械処理のための並列構造の調査
- 科学技術論文表題の日中機械翻訳
- 関係表現,助述表現の類似度を考慮した言語表現間の意味的類似度判定
- 日本語処理のための固定的共起表現辞書
- 深さ優先探索とスタックの利用を学習するCSアンプラグド教材の試作
- 日本語文の係り受け構造表示プログラム
- 漸次的に単語部分木を出力する音声認識システム
- E-034 漸次的な発話理解のための単語部分木を出力する音声認識システム(E分野:自然言語・音声・音楽)