統計的部分係り受け解析における係り受け確率の利用法 : コーパス中の構文タグ誤りの検出
スポンサーリンク
概要
- 論文の詳細を見る
品質の高いコーパスを作成するためには,構文解析器によって自動的にタグづけした後,それを人手で修正する作業が不可欠である.コーパス中のタグ誤りを効率的に見つける方法があれば,コーパス修正の人的コストを大幅に削減できると考えられる.本稿では,統計的部分係り受け解析方式によって係り受け確率を推定し,これを係り受けタグの誤り検出に利用する方法について論じる.京大コーパスを用いて実験をおこなった結果,係り受け確率がある程度誤り検出に利用できるという見通しが得られた.
- 一般社団法人情報処理学会の論文
- 1999-11-25
著者
-
乾 健太郎
九州工業大学情報工学部知能情報工学科
-
乾 孝司
東京工業大学統合研究院
-
乾 孝司
奈良先端科学技術大学院大学情報科学研究科
-
乾 孝司
筑波大学大学院システム情報工学研究科
-
乾 孝司
九州工業大学大学院情報工学研究科
関連論文
- 社会課題とその解決に結びつく科学技術に関する有用知識の抽出
- 社会課題発見のための文書クラスタリングとクラスタ評価指標(情報分析・要約(テーマセッション1))
- スピンモデルによる単語の感情極性抽出(自然言語)
- 名詞言い換えコーパスの作成環境
- 聾者向け文章読解支援のための文可読性基準の調査
- 拡張固有表現タグ付きコーパスの構築(マイニング・知識獲得・固有表現)
- イベントの生起時間帯判定(分類, ブログ)
- 1.テキスト評価分析の技術とその応用(ユーザ作成のコンテンツに着目した嗜好・評判抽出, 利用者の好みをとらえ活かす-嗜好抽出技術の最前線-)
- ブログ記事集合を用いたポストとコメントとの自動分離抽出手法の提案
- E-014 新聞記事からの社会課題に対する技術的対策情報の抽出(自然言語・音声・音楽,一般論文)
- テキスト中のイベントの生起時間帯判定(自然言語)
- 専門用語抽出における助詞情報の利用に関する一考察(情報抽出・ラベル付与)
- キーワード抽出の整数計画問題としての定式化(機械学習・応用)
- 社会課題発見のための文書クラスタリングとクラスタ評価指標(情報分析・要約(テーマセッション1))
- 文書クラスタリングによるトピック抽出および課題発見
- 文書からの組織名抽出における辞書利用(情報抽出・ラベル付与)
- 2E07 大規模テキストマイニングによる医療分野の社会課題・技術トレンド抽出(メトリクス,一般講演,第22回年次学術大会)
- 共起語に基づいた階層型文書クラスタリング手法(セッション1:テキストマイニング)
- 共起語に基づいた階層型文書クラスタリング手法(セッション1:テキストマイニング)
- 隠れ変数モデルによる複数語表現の感情極性分類(自然言語)
- テキストを対象とした評価情報の分析に関する研究動向
- 極性反転に対応した評価表現モデル(言語の統計モデル)
- 極性反転に対応した評価表現モデル(言語の統計モデル)
- 文書内に現れる因果関係の出現特性調査(解析, QA, 言語調査)
- 文書内に現れる因果関係の出現特性調査(解析, QA, 言語調査)
- スピンモデルによる単語の感情極性判定(シソーラス・辞書)
- 文書内に現れる因果関係の出現特性調査
- 接続標識「ため」に基づく文書集合からの因果関係知識の自動獲得(自然言語)
- 接続助詞「ため」を含む複文から因果関係知識を獲得する
- 接続助詞「ため」を含む複文から因果関係知識を獲得する
- 複数のパーザを利用した統計的部分係り受け解析
- 語釈文を利用した「p/n 辞書」の作成 (テーマ なぜインタラクションでなければならないか?)
- 統計的部分係り受け解析における係り受け確率の利用法 : コーパス中の構文タグ誤りの検出
- 日本語文生成における照応表現の選択
- 接続標識に基づく文書集合からの因果関係知識獲得(知識情報インフラ)(人工知能分野における博士論文)
- 統計的構文解析における構文的統計情報と語彙的統計情報の統合について
- Kura:統一的かつ宣言的記述法に基づく言い換え知識の開発環境
- 感情の生起とその反応(感情のモデルと工学的応用の動向)
- 例文を使って文の解析をしよう(ここまできた自然言語処理-例文の収集とその利用-)
- SA-7-8 規模とコストを考慮した感情タグつき言語コーパスの作成方法
- 相手の情緒を理解する対話システムの構築に向けて : 情緒タグつき対話コーパスの構築
- 統合的知能エージェントにおける並列分散処理手法
- 統合的知能エージェントにおける並列分散処理手法
- 基本情緒の強さの要因分析
- 評価表現と文脈一貫性を利用した教師データ自動獲得によるクレーム文検知(第3回集合知シンポジウム)
- E-034 レビュー集合要約における特徴的評価視点セレクション(感情・評判,E分野:自然言語・音声・音楽)
- ブログページ集合からのポストおよびコメント自動分離抽出手法