文字、単語統計解析の一手法
スポンサーリンク
概要
- 論文の詳細を見る
文字、単語などの自然言語の構成要素の統計解析は、自然言語研究の不可欠な手段である。近年は、単語の頻度、共起頻度などの統計情報をベースに、コンピュータによる単語の自動分類、シソーラスの自動生成などの研究も活発に行なわれるようになった。これらの従来の研究では、テキストデータベース(コーパス)全体にわたって統計され、平均を取った単語の頻度、共起頻度が使われており、単語がコーパスにわたる分布の情報が利用されていない。文字、単語がコーパスにわたる出現頻度の分布関数は、平均、分散、相関などの情報を含んでおり、言語の動的な側面を反映していることから、言語の統計解析に役立つことが期待できる。本稿は単語の出現頻度の分布関数を使って、単語間の相関係数という統計量を導入し、この統計量により単語間の関連性を表すことを検討する。
- 一般社団法人情報処理学会の論文
- 1995-09-20
著者
-
池田 尚志
岐阜大学 工学部 応用情報学科
-
池田 尚志
Department Of Electronics And Computer Engineering Gifuuniversity
-
兵藤 安昭
岐阜大学工学部
-
應 江黔
Faculty Of Engineering Gifuuniversity
-
兵藤 安昭
岐阜大学 工学部
-
應 江黔
岐阜大学 工学部
関連論文
- 携帯情報端末用スケーラブルフォントの試作と評価 (ヒューマンインタフェースとインタラクション)
- E_037 ミャンマー語の形式名詞構造の分析と日本語との対応(E分野:自然言語)
- E-014 日本語-ミャンマー語機械翻訳システムjaw/Myanmarにおける述語部構造の翻訳について(E.自然言語・文書・ゲーム)
- 日本語-手話機械翻訳の試みと手話文字生成編集システムおよび自動点訳編集システムについて(「ユニバーサルコミュニケーションを実現するための言語処理技術」シンポジウム)
- 品詞N-gram統計情報を用いた日本語文書における誤り検出法について
- 日本語-手話機械翻訳システムに向けて : テキストレベルの翻訳系の試作と簡単な例文の翻訳(福祉と知能・認知障害/一般)
- 手話の表記法とテキストレベルの日本語-手話機械翻訳システムの試みについて(聴覚・言語に関する障害及び加齢,聴覚・言語一般)
- K-064 日本語テキストから手話表記テキストへの機械翻訳の試み(K.ヒューマンコミュニケーション&インタラクション)
- E-34 手話における手指動作記述文の言語解析(自然言語処理応用,E.自然言語・文書)
- 手話における手指動作記述文の言語解析