辞書式順序を持つペナルティによるゼロ代名詞解消(自然言語)
スポンサーリンク
概要
- 論文の詳細を見る
日本語では,主語や目的語などが省略されることが多く,これらの省略はゼロ代名詞と呼ばれる.機械翻訳や質問応答などのシステムでは,ゼロ代名詞の解消,つまり,何が省略されているかの推定が性能向上につながると期待できる.他の自然言語処理タスクと同様,これまでは経験則に基づくアプローチが主であったが,最近,機械学習によるアプローチが注目されている.しかし,高品質な訓練データを大量に準備することは難しい.そこで本論文では,経験則と機械学習の効果的な組合せ方法を提案する.まず,照応解析の機械学習が,通常の分類学習より困難な複数インスタンス学習の一種であることを指摘し,学習を簡単化するために,経験則を導入する.既存の複数の経験則を理解しやすい形で統合するために,ペナルティの辞書式順序を定義し,実験により,選択制限と属性共有を重視した辞書式順序が,SVMに匹敵する性能を出せることを示す.そして同一表記で出現位置の異なる候補が複数ある場合に,その中で辞書式順序で一番条件の良い候補だけを使うと,機械学習の性能が向上することが実証された.さらに,最良の候補を機械学習で選択するさいに,SVMの3つのバリエーションの中で,「優先度学習」と呼ばれる手法が安定して高い性能を示すことが判明した.
- 一般社団法人情報処理学会の論文
- 2006-07-15
著者
-
賀沢 秀人
日本電信電話(株)コミュニケーション科学基礎研究所
-
磯崎 秀樹
日本電信電話(株)NTTコミュニケーション科学基礎研究所
-
平尾 努
日本電信電話株式会社NTTコミュニケーション科学基礎研究所
-
磯崎 秀樹
日本電信電話株式会社 Nttコミュニケーション科学基礎研究所
-
磯崎 秀樹
日本電信電話株式会社 Ntt コミュニケーション科学基礎研究所
-
平尾 努
日本電信電話株式会社 Ntt コミュニケーション科学基礎研究所
-
賀沢 秀人
日本電信電話株式会社nttコミュニケーション科学基礎研究所
関連論文
- 最適化問題としての文書要約
- 最大マージン原理にもとづく多重トピック文書の自動分類(フィルタリング、文書分類)(テーマ:「Webマイニングによる情報活動と自然言語処理」その他一般)
- 最大マージン原理にもとづく多重トピック文書の自動分類(フィルタリング、文書分類)(テーマ:「Webマイニングによる情報活用と自然言語処理」その他一般)
- ネット情報を使ってホットなものを選ぶシステム : DSIUシステム : Decision Support for Internet Users
- DSIUシステム : Decision Support for Internet Users「ネット情報を使ってホットなものをあなたに! 」
- モデル検査に基づく知識・信念の推定(「定理証明, 推論関係の新技術」)
- テキスト要約の自動評価(テキストの自動評価)
- 抜粋による複数文書要約を評価するためのコーパスと評価指標
- 生成・識別モデルの統合に基づく半教師あり学習法とその多重分類への応用
- F値最大化学習に基づく文書の多重ラベリング(機械学習)
- 高次元特徴空間に適した半教師あり条件付確率場の検証(機械学習)
- 識別学習による組合せ最適化問題としての文短縮手法
- 単一言語コーパスにおける文の自動対応付け手法(自然言語)
- SVMを用いた学習型質問応答システムSAIQA-II(自然言語)
- 機械学習のための組み合わせ素性の選択基準について(分類、クラスタリング,機械学習)
- 言語パターンに着目した複数文書要約(要約)
- 機械学習のための組み合わせ素性の選択基準について(分類、クラスタリング, 機械学習)(言語理解とコミュニケーション)
- 言語パターンに着目した複数文書要約(言語理解とコミュニケーション)
- 機械学習のための組み合わせ素性の選択基準について
- 言語パターンに着目した複数文書要約
- 素性選択機能をもったString Kernelの提案(パタン発見)(セマンティックウェブと自然言語処理その他一般)
- 素性選択機能をもった String Kernel の提案
- 階層構造を利用したテキスト間類似度の効率的計算法
- SAIQA : 大量文書に基づく質問応答システム
- SAIQA : 大量文書に基づく質問応答システム
- 聞き役対話システムの構築を目的とした聞き役対話の分析
- 構文情報に依存しない文短縮手法
- 生成・識別モデルの統合に基づく半教師あり学習法とその多重分類への応用
- 投票型回帰モデルによる要約の自動評価法
- 辞書式順序を持つペナルティによるゼロ代名詞解消(自然言語)
- 拡張ストリングカーネルを用いた要約システムの自動評価法(自然言語,情報処理技術のフロンティア)
- 最大マージン原理に基づく多重ラベリング学習(自然言語処理)
- 文書要約の自動評価手法の提案と評価(セグメンテーション・要約)
- 優先度学習を用いた自然言語処理(解析)
- 生物医学文献からの遺伝子機能フレーズの抽出(抽出,マイニング)
- DSIUシステム : ネット情報を使った意思決定支援
- ネット情報を使った意思決定支援 : DSIU
- 自然言語処理のためのSVM高速化
- 自然言語処理のためのSVM高速化
- 自動要約評価型ワークショップ : Text Summrization Challenge(TSC)(音声・言語における標準化動向)(第6回音声言語シンポジウム)
- 自動要約評価型ワークショップ : Text Summrization Challenge(TSC)(音声・言語における標準化動向)(第6回音声言語シンポジウム)
- 自動要約評価型ワークショップ : Text Summrization Challenge(TSC)(音声・言語における標準化動向)(第6回音声言語シンポジウム)
- 動向情報の要約と可視化に関するワークショップの提案(検索,要約)
- 動向情報の要約と可視化に関するワークショップの提案(検索,要約)
- 文書要約における抽出単位と評価法についての考察(要約)
- 音声インタラクティブODQAの構築とその評価
- 探しもの見つけます : 情報化社会に役立つ情報検索の技術動向
- 質問応答システムの比較と評価
- 固有表現抽出のためのSVMの高速化
- 質問応答システム:SAIQA--何でも答える物知り博士 (特集論文1 高度検索技術)
- 質問に適応した文書要約手法とその評価
- 世界図書館を飲み込む次世代ヒューマノイド--知識処理と言語処理の新しい展開 (特集論文1 人にやさしい対話型コンピュータ)
- AAAI-99参加報告
- 生物医学文献からの遺伝子機能フレーズの抽出(抽出, マイニング)(言語理解とコミュニケーション)
- チャレンジ報告 : 電化製品を扱う DSIU
- 音声駆動型QAシステム実現のための言語モデルと対話戦略の検討 (テーマ:一般)
- 4. 論理の逆計算 : 計算機科学の立場から( 逆計算: 計算の理論における逆問題)
- 生物医学文献からの遺伝子機能フレーズの抽出
- セグメント単位の評価指標最大化に基づく条件付確率場の学習
- Support Vector Machineを用いた重要文抽出法(自然言語)
- 機械学習による複数文書からの重要文抽出
- LE-11 機械学習を用いた複数文書要約(E. 自然言語・文書)
- SVMに基づく固有表現抽出の高速化
- メタルールと決定木学習を用いた日本語固有表現抽出(システムLSIの設計技術と設計自動化)
- 固有表現抽出のための可読性の高い規則の自動生成
- 並行実行される固有表現抽出規則の一括生成
- 辞書式優先順位に基づく日本語固有表現抽出
- マルチエージェント環境で他者の信念の変遷を推定する前進的アルゴリズム
- セグメント単位の評価指標最大化に基づく条件付確率場の学習(自然言語処理)
- 文書要約における抽出単位と評価法についての考察(言語理解とコミュニケーション)
- Order SVM : 一般化順序統計量に基づく順位付け関数の推定(情報論的学習理論論文小特集)
- 大規模データを用いた半教師あり学習による高精度係り受け解析モデルの学習
- TD-3-2 なぜSVMを使うのか? : ユーザーから見た利点(TD-3. 天下無敵のサポートベクトルマシン?)
- LG-5 順序関係を推定する位置づけ学習問題とその解法(G. 人工知能)
- 順位づけ学習問題 : 順位つきサンプルを用いた順序関係推定
- 順位づけ学習問題 : 順位つきサンプルを用いた順序関係推定
- マルチエージェント環境における遡行的信念推定アルゴリズム
- トランザクション論理におけるプログラム変換
- 語順の相関に基づく機械翻訳の自動評価法