中国語高頻度単語の品詞と近距離単語について
スポンサーリンク
概要
- 論文の詳細を見る
近年,中国語の計算機処理の研究が進んでいる.中国語の〓音による入力,中国語音声の機械認識では言語情報を有効に利用しなければならないことは言うまでもない.そこで筆者らは中国語の性質を知るために中国語高頗度単語6321語(母集団)について調査を行なっている.品詞情報を考慮しない場合の〓音表記音素による近距離単語については著者らが既に報告した.品詞を考慮しない湯合,〓音表記による距離1の単語数は声調を考慮しても一漢字単語では1単語当り平均約43語あり,単語単位の音声認識或は音声認識誤りの訂正が極めて難しい.そこで品詞情報が中国語の機械処理にいかなる効果を持っているかの調査をした.本文では高頻度単語に含まれる各品詞の割合と単語の品詞が明らかになった場合の近距離単語数についての調査結果をのべる.
- 1990-09-04
著者
関連論文
- 3次元グラフ構造の最大共通部分を求めるアルゴリズム
- 点パターンマッチングアルゴリズムの効率化
- 順序がない木の間の類似度問題
- 平面に埋め込まれた木の最大共通類似部分問題
- 順序がない木の最大類似部分問題
- 外平面グラフの点部分同型判定アルゴリズム
- 順序がない木の距離を求めるアルゴリズム
- 木の最大類似部分問題とそのアルゴリズム
- 二つの外平面描写の最大共通部分の抽出について
- 木の描写アルゴリズムの効率化
- 二つの木の最大共通部分グラフを求めるアルゴリズム
- 線図形の類似度とその計算法
- 根がなく巡回的順序がある木の間の距離とその計算法
- 構造をもつものの距離と類似度
- 文脈言語の下降形誤り訂正構文解析法
- 綴り誤りの高速訂正法
- 平面に埋め込まれた木の間の距離およびその計算法
- 拡張ハッシュ法を用いた類似キー検索ファイル
- 根がなく巡回的順序を持つ木の距離とその計算法
- 誤り訂正構文解析法 : 研究の現状と問題点(代数的コード理論および語の組合せ論)
- 大型データペースのための最長共通部分列の一高速抽出法
- 階層的ファイルを用いた中国語単語の検索法
- グラフの部分整合アルゴリズム
- 空間に埋め込まれた木のグラフ理論的距離とその計算法
- 空間に埋め込まれた木の距離とその計算法
- 節点の分離・融合操作に基づく木の距離について
- 動的計画法に基づくル-プのない文脈言語の構文解析法
- 一般化LR構文解析法に基づく文脈自由言語の誤り訂正
- 中国語高頻度単語の〓音対
- 中国語高頻度単語の品詞と近距離単語について
- 機械処理のための中国語併音の調査
- 拡張可能類名表記を用いた類似キー検索ファイル
- THEORETICAL ASPECTS OF SYNTACTIC PATTERN RECOGNITION