隣接文字の分散値を用いた定型表現の自動抽出
スポンサーリンク
概要
- 論文の詳細を見る
本論文では、「文字列が意味のあるまとまりである時、その文字列の前後には様々な文字が出現する」という考えに基づき、隣接文字の分散の度合を基準として、表現の単位として有効な文字列の抽出を行なう方法を提案する。分散値は、文字列に隣接する文字の種類と各文字の生起確率によって計算する。計算にはエントロピー基準を導入した。また、本手法を約4,000万字の新聞記事データに適用した結果を紹介し、本手法の有効性を示す。
- 一般社団法人情報処理学会の論文
- 1995-11-17
著者
-
杉尾 俊之
沖電気工業株式会社研究開発本部関西総合研究所
-
下畑 さより
沖電気工業株式会社ユビキタスサービスプラットフォームカンパニー
-
永田 淳次
沖電気工業(株)研究開発本部関西総合研究所
-
下畑 さより
沖電気工業(株)研究開発本部関西総合研究所
-
下畑 さより
沖電気工業(株)
-
杉尾 俊之
沖電気工業
関連論文
- 開発者の視点からの機械翻訳システムの技術的評価 : テストセットを用いた晶質評価法
- 日英特許コーパスからの専門用語対訳辞書の自動獲得
- 単語長と出現回数を考慮した対訳文書からの訳語検出(翻訳,対話)
- ラダリング型検索サービスのためのドメイン知識構築,及び,実証実験(対話型情報アクセス(テーマセッション4))
- ラダリング型検索サービスのための対話エンジンの設計・開発(対話型情報アクセス(テーマセッション4))
- ラダリング型検索サービスのためのドメイン知識構築,及び,実証実験(対話型情報アクセス(テーマセッション4))
- ラダリング型検索サービスのための対話エンジンの設計・開発(対話型情報アクセス(テーマセッション4))
- 対訳パターンを辞書とする翻訳システム
- WWWのリアルタイム翻訳を可能とする機械翻訳システム
- WWW用機械翻訳システム:W3-PENSEE
- WWW用機械翻訳システム : W3-PENSEE
- 快適なインターネットサーフィングを支援するWWW用機械翻訳システム
- 言語の違いを意識しないインターネット利用を可能とするWWW用機械翻訳システム
- ユ-ザフレンドリな機械翻訳システム:PENSEE (先端技術特集)
- 日英機械翻訳における慣用表現の辞書登録方式
- 形態素解析のための知識獲得方式
- 日本語長文の翻訳における副詞呼応範囲の優先構造化方式
- 日本語文の並列構造を利用した長文解析方式
- 言語処理系の生成系MYLANGによるNBSG/PDプリコンパイラの試作
- 連想辞書を利用した意味検索システム (先端技術特集)
- 文字種切り出しと複合語分解によるキーワード抽出
- 文字種切り出しと複合語分解によるキーワード抽出
- 相関表現を含む英語長文の文構造解析
- 比喩認識システムのための知識獲得と比喩性判定
- 比喩認識システムにおける比喩候補の抽出と分類
- 英語長文における比較構文のモデル構築と解析
- 比較構造の特性を利用した英日機械翻訳処理の検討 : 実用文コーパスにおける as...as 構文処理のモデル化
- "as…as"の特性を利用した英日機械翻訳処理の検討
- 英日機械翻訳における名詞句並列を含む長文解析について
- 文書改版時の翻訳を支援する機械翻訳システム (ネットワ-ク特集)
- 隣接文字情報を用いたn-gram抽出文字列からの名詞句の自動抽出
- 隣接文字情報を用いた n-gram抽出文字列からの名詞句の自動抽出
- 隣接文字の分散値を用いた定型表現の自動抽出
- 日常業務で使う機械翻訳ツール(機械翻訳)
- 第7回機械翻訳サミット参加報告
- n-gram 統計による抽出文字列の品詞推定
- 改版文書の翻訳を支援する差分翻訳システム
- 差分翻訳システムにおける対訳文書の文の対応付け
- 機械翻訳システム「パンセ」におけるユ-ザインタフェ-ス (文書処理特集)