相互情報量を用いた単語の分類における出現頻度の低い単語の処理手法
スポンサーリンク
概要
- 論文の詳細を見る
形態素解析や構文解析等において,単語がどのように分類されているかは,重要な問題である.英文の大量のテキストデータをもとに単語を分類する一手法として,相互情報量を用いた手法が提案されている.しかし,相互情報量による分類手法は,出現頻度の低い単語の分類には適していない.そこで,対象とするテキストデータ中の出現頻度の低い単語については,何らかの処理を行ない,相互情報量を用いた単語の分類手法に組み込むことで,適切に分類できるであろう.本稿では,相互情報量を用いた単語の分類手法について述べると共に,不安定な出現頻度の低い単語の処理をどのように組み込むかについて述べる.出現頻度の低い単語を分類する手法として,(1)人手による分類手法,(2)ある程度の出現頻度になるまで出現頻度の低いものをまとめる手法,(3)単語の文字特徴を利用した分類手法,(4)2-gramを利用した分類手法,の4つを取り上げる.
- 一般社団法人情報処理学会の論文
- 1994-09-20
著者
関連論文
- 京都観光案内対話コーパスにおける対話行為タグの設計と分析(理解)
- 同調的対話システム構築のための音声対話コーパスの構築(「ユニバーサルコミュニケーションを実現するための言語処理技術」シンポジウム)
- 言語獲得ロボットによる発話理解確率の推定に基づく物体操作対話 (第27回日本ロボット学会学術講演会論文特集号(2))
- 統計的対話モデルを用いたWFSTに基づく音声対話システム
- 同調的対話を実現するプロトタイプシステムの開発(対話・インタフェース・インタラクション)
- 節の始境界検出に基づく独話文の係り受け解析
- DiaLeague : 自然言語処理システムの総合評価
- 音声認識の信頼度・複数候補を利用したWFST対話システムの評価
- 相談型対話のモデル化と対話戦略の最適化
- 科学技術コミュニケーションにおける対話のデザイン : 自律型対話の実践に向けて(実践的多人数インタラクションの動向と展望)
- 発話連鎖からみた情報要求発話の機能(分析、生成と評価)(音声とコミュニケーション及び一般)
- 発話連鎖からみた情報要求発話の機能
- 用例ベース翻訳の確率的モデル化
- 対話者の社会的役割を利用した訳し分け手法
- 固有表現抽出器を用いた、非直訳文書対からの固有表現翻訳対獲得(対訳表現獲得)
- 講演の同時通訳データ作成と分析
- 1N-7 異なる辞書を利用した意味コードの自動付与
- 詳細な文法を用いた統計的構文解析法
- 決定木学習による形態素解析 (言語・音声理解と対話処理研究会(第17回))
- Probabilistic Decision-Tree Tagging Without A Dictionary
- 対話システムの評価における一般的推論能力の要請
- The ATR/Lancaster General-American-English Treebank
- A New Approach To Treebank Creation
- 相互情報量を用いた単語の分類における出現頻度の低い単語の処理手法
- 構文木コーバスの再構成手法
- 構文木データべース作成用ツール
- 音声言語処理のためのコ-パスとタギング(チュ-トリアル講演)
- 独話データのポーズ単位を利用した節境界判定(言語解析, 対話)
- 文脈素性のベクタ空間モデルを用いた日英翻訳選択 : SENSEVAL-2 日本語翻訳タスク参加システムの開発
- 節の始端検出に基づく独話文の係り受け解析(一般(ポスターセッション),第9回音声言語シンポジウム)
- 節の始端検出に基づく独話文の係り受け解析(一般(ポスターセッション),第9回音声言語シンポジウム)
- 節の始端検出に基づく独話文の係り受け解析(一般(ポスターセッション),第9回音声言語シンポジウム)
- 節境界に基づく独話の漸進的係り受け解析(自然言語処理)
- 同時的な独話音声要約に基づくリアルタイム字幕生成(要約・分割)
- 節境界単位での漸進的な独話係り受け解析
- 節境界に基づく独話文係り受け解析の効率化(仮名漢字変換・形態素構文解析)
- 日本語節境界検出プログラムCBAPの開発と評価
- 用例ベース翻訳のための日英アライメント確信度語類似度を用いた訳語選択
- 単語類似度の尺度比較支援ツールの作成(言語知識・解析・言い換え)
- ATR-SLTシステム-SENSEVAL-2日本語翻訳タスク
- APPLYING CONTEXTUAL SYNTACTIC AND SEMANTIC TAGS TO MAXIMUM ENTROPY BASED LANGUAGE MODELING
- THE MAXIMUM ENTROPY APPROACH TO LANGUAGE MODELLING OF ATRSPREC
- LINGUISTIC QUESTION-BASED LANGUAGE MODEL BUILT BY ME