隣接文字情報を用いた n-gram抽出文字列からの名詞句の自動抽出
スポンサーリンク
概要
- 論文の詳細を見る
本論文では、n-gram統計により抽出された文字列の中から、名詞句だけを精度良く抽出する方法について述べる。本手法は、品詞および隣接文字情報を付与したn-gram統計文字列を学習データとし、各文字の名詞に接続する確率を求める。そして、これを推定対象文字列の隣接文字に適用することにより、文字列の名詞となる確率を算出する。本手法を用いた名詞句推定実験では適合率82.9%、再現率80.4%を得ることができた。
- 一般社団法人情報処理学会の論文
- 1996-07-18
著者
-
杉尾 俊之
沖電気工業株式会社研究開発本部関西総合研究所
-
下畑 さより
沖電気工業株式会社ユビキタスサービスプラットフォームカンパニー
-
下畑 さより
沖電気工業(株)研究開発本部関西総合研究所
-
下畑 さより
沖電気工業(株)
-
杉尾 俊之
沖電気工業
関連論文
- 開発者の視点からの機械翻訳システムの技術的評価 : テストセットを用いた晶質評価法
- 日英特許コーパスからの専門用語対訳辞書の自動獲得
- 単語長と出現回数を考慮した対訳文書からの訳語検出(翻訳,対話)
- ラダリング型検索サービスのためのドメイン知識構築,及び,実証実験(対話型情報アクセス(テーマセッション4))
- ラダリング型検索サービスのための対話エンジンの設計・開発(対話型情報アクセス(テーマセッション4))
- ラダリング型検索サービスのためのドメイン知識構築,及び,実証実験(対話型情報アクセス(テーマセッション4))
- ラダリング型検索サービスのための対話エンジンの設計・開発(対話型情報アクセス(テーマセッション4))
- 対訳パターンを辞書とする翻訳システム
- 日英機械翻訳における慣用表現の辞書登録方式
- 形態素解析のための知識獲得方式
- 言語処理系の生成系MYLANGによるNBSG/PDプリコンパイラの試作
- 連想辞書を利用した意味検索システム (先端技術特集)
- 文字種切り出しと複合語分解によるキーワード抽出
- 文字種切り出しと複合語分解によるキーワード抽出
- 相関表現を含む英語長文の文構造解析
- 比喩認識システムのための知識獲得と比喩性判定
- 比喩認識システムにおける比喩候補の抽出と分類
- 英語長文における比較構文のモデル構築と解析
- 比較構造の特性を利用した英日機械翻訳処理の検討 : 実用文コーパスにおける as...as 構文処理のモデル化
- "as…as"の特性を利用した英日機械翻訳処理の検討
- 英日機械翻訳における名詞句並列を含む長文解析について
- 文書改版時の翻訳を支援する機械翻訳システム (ネットワ-ク特集)
- 隣接文字情報を用いたn-gram抽出文字列からの名詞句の自動抽出
- 隣接文字情報を用いた n-gram抽出文字列からの名詞句の自動抽出
- 隣接文字の分散値を用いた定型表現の自動抽出
- 日常業務で使う機械翻訳ツール(機械翻訳)
- 第7回機械翻訳サミット参加報告
- n-gram 統計による抽出文字列の品詞推定
- 改版文書の翻訳を支援する差分翻訳システム
- 差分翻訳システムにおける対訳文書の文の対応付け