日本語文入力用カタカナ語検出規則とオンライン国語辞典の一分析
スポンサーリンク
概要
- 論文の詳細を見る
単語わかち書きされたかな書きの日本語文において, ひらがな語とカタカナ語の区別が前もって与えられていないとするとき, 規則(1)長音符を含む語はカタカナ語, (2)ンまたは小さいッの直後以外にパ行音があらわれたらカタカナ語, および(3)小さいァィゥェォを含む語はカタカナ語, の以上三つを利用すると, ひらがなとカタカナの切りわけという問題のかなりの部分を利用者による積極的指定なく処理でき, これらの規則にあてはまらない場合の処置も容易であることはすでに報告した. 本文では三省堂「新明解国語辞典第二版」の見出し項目を全数検査することによってこれら3規則の性能を評価するとともに, 類似の規則を追加することによって性能の向上をはかることができないか調べる. おもな結果は次の通り. (a)上記3規則には事実上例外がない. すなわちひらがな語を誤ってカタカナ語と判定することははっきり特殊とわかる場合を除いてはほとんど存在しない. (b)3規則でカバーされるカタカナ語の割合は60%近い. (c)ション, ックスなど外来語によくある語尾に着目する方法は思いがけない例外があって上記3規則ほど具合がよくない.
- 一般社団法人情報処理学会の論文
- 1982-03-15
著者
関連論文
- ソフトウェア専門家を志す人のための基礎訓練科目
- (48) 情報系専門学科のカリキュラムのアイデンティティと評価方法(第4セッション 教育評価方法)
- パネル討論会 : ソフトウェアの使いやすさ : 昭和57年前期第24回全国大会報告
- 宗森ほか「次候補表示方法の入力効率に及ぼす影響について」再論
- 宗森ほか「次候補表示方法の入力効率に及ぼす影響について」に対する疑問
- かな漢字変換における候補判定時間の状況別分布
- 快速ローマ字配列およびドボラック配列とQWERTY配列の相互干渉
- 情報処理専門教育について 大学等における情報系専門教育の改善への提言
- コンピュータサイエンスの社会的認識
- パソコン用打鍵データ収集システム
- ソフトウェア科学と「科学」
- マン・マシンシステムとしての日本語ワープロ(マン・マシンシステム)
- UNIXの限界と今後の進路 (UNIX)
- 直感, 情報的現象の海
- 「松」とJWORDの比較論
- 26. 文書整形言語 (プログラミング言語の最近の動向)
- 仮想記憶における有効実記憶容量推定工具とその設計
- パネル討論会 : 構造的プログラミング : 昭和50年度第16回大会報告
- プログラミング : 工芸から科学へ
- Software Tool とは何か?(ソフトウェアツール 2 : 製造・評価・保守)
- 数値計算と入カ設計 (数学的ソフトウェアの評価)
- 読まれる英文論文を書くために
- 保護の領域とプロセスの管理
- プログラミング方法論の問題点 : 超職業的プログラミングについて
- 東京工業大学理学部情報科学科における専門的情報処理教育
- 連続的非同期式回路理論の諸問題 (情報科学の数学的理論)
- 日本語文入力用カタカナ語検出規則とオンライン国語辞典の一分析