かな漢字変換から拡張・一殿化した日本語処理プラットホームの提案
スポンサーリンク
概要
- 論文の詳細を見る
日本語処理技術はかな漢字変換(KKC), 文書校正支援, 機械翻訳, テキスト音声合成, 音声認識, 文字認識, ペン入力, 情報検索などのこれら日本語アプリケーション(Appと略す)にとっての必要不可欠な要素技術であり, また基盤技術でもある. これらの各Appは高精度・高機能化のため年々大規模・複雑化している. しかし, これらのAppはそれぞれ共有可能な処理・知識があってもそれぞれが閉じた別個の処理を行っており, さらにまた各Appは精度向上のために知識を拡充する必要があるが, それぞれのAppで重複した知識を用意している. このためリソースの効率的使用はもちろんApp間の連携処理による相乗効果が生まれにくくなっており, 日本語処理全体としての視点(ユーザー及び開発側からの)が欠けているように思われる. 本論文では, 肥大化しつつある各Appを統合化するために最共通要素として形態素解析を例にとり, 形態素解析で最も広く普及しているかな漢字変換システムからの知見をとりいれ, かな漢字変換を拡張・一般化する方向で検討を行うことで日本語処理全体の構成要素の部品化を目指して日本語処理のための共通のプラットホームを提案する.
- 一般社団法人情報処理学会の論文
- 1994-03-07
著者
-
鳥原 信一
日本アイ・ビー・エム株式会社東京基礎研究所
-
野崎 広志
日本アイ・ビー・エム(株)東京基礎研究所
-
野崎 広志
(株)日本アイ・ビー・エム東京基礎研究所
-
鳥原 信一
(株)日本アイ・ビー・エム東京基礎研究所
-
野崎 広志
日本アイ・ビー・エム 大和研究所
関連論文
- 代表読み辞書を用いた交ぜ書き漢字変換
- かん字漢字変換の変換率について
- 表記変換つきの形態素解析プログラムとその応用
- 連文節かん字漢字変換
- 2ZA-2 音声対話を含むマルチ・モダル型ユーザ・インターフェースの実装とそのユーザビリティの評価の検討(マルチモーダル,一般講演,インタフェース)
- 日本語テキスト音声合成のための言語処理の検討
- 音声対話を含むマルチ・モダル型ユーザ・インターフェースの在宅健康管理システムへの適用
- コーパス間の類似度によるコーパス分類と専門分野別辞書構築
- N-gramによる同形語の読み分け
- 漢字N-gramを用いた読み付与システム
- 漢字N-Gramによる日本語テキストの読み付与
- 同音語誤りリストからのかな漢字変換辞書作成
- かな漢字変換から拡張・一殿化した日本語処理プラットホームの提案
- テキストの共起単語情報を用いたかな漢字変換
- テキスト・ベースかな漢字変換
- かな漢字変換と漢字かな変換を共に用いる同音語誤りの検出方式
- オンライン文字認識における後処理 : 住所・姓名の文字補完機能
- カナ姓名のペン入力後処理における予測処理について
- 認識文字候補からの高速予備選択法
- 日本語Dictation Systemのための統計的言語モデルに関する一考察