PPM法を用いたかな漢字変換の学習モデル
スポンサーリンク
概要
- 論文の詳細を見る
かな漢字変換では、ユーザが過去に入力した文章中の情報を学習する。学習手法には、1.前に入力した単語を次回先頭候補にする、2.単語の頻度情報を登録する、3.単語の共起情報を登録する、4.単語のn-gram情報を登録する、のような手法が考えられる。1〜3までの手法を用いた学習モデルは、既に存在するが、4の単語n-gram情報を用いたモデルはあまり例が無いと思われる。そこで、本研究では、単語n-gram情報を用い、圧縮の分野で用いられている学習手法であるPPM(Prediction by Partial Matching)法を用いたかな漢字変換の学習手モデルを提案し、その性能評価を行った。
- 一般社団法人情報処理学会の論文
- 2001-11-20
著者
-
武市 正人
東京大学大学院情報理工学系研究科
-
武市 正人
電気通信大学電気通信学部計算機科学科
-
武市 正人
東京大学
-
武市 正人
東京大学工学部
-
田中 久美子
東京大学大学院情報理工学系研究科
-
田中 久美子
東京大学 大学院 情報学環
-
丸山 卓久
東京大学大学院工学系研究科情報工学専攻
-
田中(石井) 久美子
東京大学大学院情報学環
関連論文
- 少数キーを用いた日本語入力
- 3M-5 Bidirectional XML Transformation with Bi-X
- 3M-4 依存関係記述スキーマによる双方向XMLアプリケーションの開発(リーディングプロジェクト e-society:高信頼プログラミング言語と構造化文書変換技術,一般セッション,リーディングプロジェクト e-society)
- 3M-3 双方向変換に基づくウェブパブリッシング支援システムVu-X(リーディングプロジェクト e-society:高信頼プログラミング言語と構造化文書変換技術,一般セッション,リーディングプロジェクト e-society)
- 神経系の双方向マルチスケールシミュレーションと100時間ワークショップ : 東京大学21世紀COEプログラム「情報科学技術戦略コア」
- 2. 情報科学技術戦略コア(21世紀卓越した情報研究拠点プログラムの目指す研究(前編))
- 情報科学技術戦略コア
- 5-2-1 東京大学「情報科学技術戦略コア」(5-2 情報・電気・電子分野の21世紀COE,3プロジェクトの拠点リーダーより)(5.大学での研究プロジェクト : 21世紀COEプログラム)(グローバル化時代の教育と研究)
- 1.マルチコア計算機と基本的な並列化技法(マルチコアを活かすお手軽並列プログラミング)
- インターネットを用いた複数経路データ伝送方式の性能評価