複数のパーザを利用した統計的部分係り受け解析
スポンサーリンク
概要
- 論文の詳細を見る
我々はこれまでに, 信頼のおける部分だけを出力し被覆率を犠牲とする代償として正解率を向上させる統計的部分解析手法の調査を進めてきた.本稿では, さらにこの考えに委員会方式という概念を統合した枠組みを提案し, その評価を行った.委員会方式とは, 複数の解析器(委員)の出力解を組み合わせることにより解析精度の向上をはかる手法である.ここでは, 各委員から得られる解析結果に基づき委員会で多数決により統計的部分解析を行うために, 従来の基本的な委員会方式に3つの拡張を施した:(1)解析器(委員)が推定した係り受け確率を票の重みと見なして重みつきの票を投じる確率的投票, (2)委員間での票の重みの信頼性を標準化する重み標準化, (3)各係り文節に対して2位以下の係り先候補にも重みつきの票を投じる多重投票.既存の5つの統計的解析器を用いて, 京大コーパスを対象データとする解析実験を行った.その結果, 委員の組合せによって精度変化には多少の揺れがあるものの, 総合的には提案した枠組みおよび3つの拡張が解析精度の向上に有効に作用する見通しを得た.
- 一般社団法人情報処理学会の論文
- 2001-12-15
著者
関連論文
- 社会課題とその解決に結びつく科学技術に関する有用知識の抽出
- 社会課題発見のための文書クラスタリングとクラスタ評価指標(情報分析・要約(テーマセッション1))
- スピンモデルによる単語の感情極性抽出(自然言語)
- 名詞言い換えコーパスの作成環境
- 聾者向け文章読解支援のための文可読性基準の調査
- 拡張固有表現タグ付きコーパスの構築(マイニング・知識獲得・固有表現)
- イベントの生起時間帯判定(分類, ブログ)
- 1.テキスト評価分析の技術とその応用(ユーザ作成のコンテンツに着目した嗜好・評判抽出, 利用者の好みをとらえ活かす-嗜好抽出技術の最前線-)
- ブログ記事集合を用いたポストとコメントとの自動分離抽出手法の提案
- E-014 新聞記事からの社会課題に対する技術的対策情報の抽出(自然言語・音声・音楽,一般論文)
- テキスト中のイベントの生起時間帯判定(自然言語)
- 専門用語抽出における助詞情報の利用に関する一考察(情報抽出・ラベル付与)
- キーワード抽出の整数計画問題としての定式化(機械学習・応用)
- 社会課題発見のための文書クラスタリングとクラスタ評価指標(情報分析・要約(テーマセッション1))
- 文書クラスタリングによるトピック抽出および課題発見
- 文書からの組織名抽出における辞書利用(情報抽出・ラベル付与)
- 2E07 大規模テキストマイニングによる医療分野の社会課題・技術トレンド抽出(メトリクス,一般講演,第22回年次学術大会)
- 共起語に基づいた階層型文書クラスタリング手法(セッション1:テキストマイニング)
- 共起語に基づいた階層型文書クラスタリング手法(セッション1:テキストマイニング)
- 隠れ変数モデルによる複数語表現の感情極性分類(自然言語)
- テキストを対象とした評価情報の分析に関する研究動向
- 極性反転に対応した評価表現モデル(言語の統計モデル)
- 極性反転に対応した評価表現モデル(言語の統計モデル)
- 文書内に現れる因果関係の出現特性調査(解析, QA, 言語調査)
- 文書内に現れる因果関係の出現特性調査(解析, QA, 言語調査)
- スピンモデルによる単語の感情極性判定(シソーラス・辞書)
- 文書内に現れる因果関係の出現特性調査
- 接続標識「ため」に基づく文書集合からの因果関係知識の自動獲得(自然言語)
- 接続助詞「ため」を含む複文から因果関係知識を獲得する
- 接続助詞「ため」を含む複文から因果関係知識を獲得する
- 複数のパーザを利用した統計的部分係り受け解析
- 語釈文を利用した「p/n 辞書」の作成 (テーマ なぜインタラクションでなければならないか?)
- 統計的部分係り受け解析における係り受け確率の利用法 : コーパス中の構文タグ誤りの検出
- 日本語文生成における照応表現の選択
- 接続標識に基づく文書集合からの因果関係知識獲得(知識情報インフラ)(人工知能分野における博士論文)
- 統計的構文解析における構文的統計情報と語彙的統計情報の統合について
- Kura:統一的かつ宣言的記述法に基づく言い換え知識の開発環境
- 感情の生起とその反応(感情のモデルと工学的応用の動向)
- 例文を使って文の解析をしよう(ここまできた自然言語処理-例文の収集とその利用-)
- SA-7-8 規模とコストを考慮した感情タグつき言語コーパスの作成方法
- 相手の情緒を理解する対話システムの構築に向けて : 情緒タグつき対話コーパスの構築
- 統合的知能エージェントにおける並列分散処理手法
- 統合的知能エージェントにおける並列分散処理手法
- 基本情緒の強さの要因分析
- 評価表現と文脈一貫性を利用した教師データ自動獲得によるクレーム文検知(第3回集合知シンポジウム)
- E-034 レビュー集合要約における特徴的評価視点セレクション(感情・評判,E分野:自然言語・音声・音楽)
- ブログページ集合からのポストおよびコメント自動分離抽出手法