迂言表現と重複表現の認識と言い換え
スポンサーリンク
概要
- 論文の詳細を見る
言い換え処理は,様々な自然言語処理アプリケーションで必要とされている非常に重要な技術である.言い換え処理の一つとして,本論文では「名詞+ 格助詞+ 動詞」という形の迂言表現と重複表現を国語辞典を用いて認識し,さらにそれらを言い換える手法を提案する.迂言表現とは,動詞が動作を表していない表現や,名詞が動作の主体や対象を表わさずに動作の状態を表している表現のことである.そして重複表現とは,動詞と名詞の間に意味の重複がある表現のことである.これらの表現には,多くの場合,同じ意味をより簡潔な形であらわした表現が存在する.提案手法の認識処理と言い換え処理の精度を二人の被験者が判断したところ,認識処理の精度は,平均して適合率78%,再現率52%であった.また,言い換え処理の精度は平均して91%であった.Paraphrasing is a very important technique which is required by a lot of NLP applications. This paper represents a dictionary-based method of recognizing and paraphrasing periphrastic phrases and overlapping phrases. A periphrastic phrase is a phrase in which a verb does not represent an action, or a noun does not represent an agent/object of an action. An overlapping phrase is a phrase in which there is overlapping meaning between a noun and a verb. Most of these phrases have equivalent phrases which are expressed in a simpler form. The result of recognition and paraphrasing was assessed by two human judges. The result of recognition was evaluated through precision and recall, and the average precision and recall were 78% and 52% respectively. The average accuracy of paraphrasing was 91%.
- 言語処理学会,The Association for Natural Language Processing,東京大学大学院情報理工学系研究科,Graduate School of Information Science and Technology, the University of Tokyo,科学技術振興機構さきがけ, PRESTO, JSTの論文
- 2004-01-10
著者
関連論文
- 大規模ウェブテキストからの片仮名用言の自動獲得(テキストマイニング,データ工学論文)
- ボーンデジタル時代におけるウェブアーカイブとその活用基盤としてのSocio-Sense(Webアーカイビングの現状と課題)
- コーパスからの固有表現辞書の自動構築 (「機械学習とその応用」および一般発表)
- 自動抽出した換喩表現を用いた係り受け関係のずれの解消
- 10.Socio Sense : 過去9年に及ぶWebアーカイブから社会の動きを読む(第2部:情報の高信頼蓄積・検索技術等の開発,学と産の連携による基盤ソフトウェアの先進的開発)
- Webマイニングにおける語義曖昧性解消のための擬似負例を用いた能動学習
- 5L-6 ウェブからの分析対象文書抽出手法の検討(リーディングプロジェクト e-society:WebアーカイブとWebデータ解析技術,一般セッション,リーディングプロジェクト e-society)
- 大規模テキスト知識ベースに基づく自動質問応答 : ダイアログナビ
- 自動質問応答システム,ダイアログナビの現状と課題
- 用例ベース翻訳のための日英アライメント確信度語類似度を用いた訳語選択
- WWWを用いた書き言葉特有語彙から話し言葉語彙への用言の言い換え
- 用例ベース翻訳のための対訳文の句アライメント
- 用例ベース翻訳のためのパラレルコーパスからの対訳対発見
- 用例ベース翻訳のためのパラレルコーパスからの対訳対発見
- 大規模コーパスからの語義のマイニング
- 格フレームの対応付けに基づく用言の言い換え
- 辞書定義文の圧縮による定義表現パターンの発見
- 国語辞典に基づく平易文へのパラフレーズ
- 国語辞典に基づく平易文へのパラフレーズ
- 新動詞の成立にみる意味と形の変化の相関--「ファブる」と「モフる」の分析から
- 高性能計算環境を用いたWebからの大規模格フレーム構築
- 名詞格フレーム辞書の自動構築とそれを用いた名詞句の関係解析
- 格フレーム辞書の漸次的自動構築
- 自動構築した格フレーム辞書と先行詞の位置選好順序を用いた省略解析
- 用言と直前の格要素の組を単位とする格フレームの自動構築
- 会話コンテンツ獲得と管理(会話情報学)
- 知識カードを用いた分身エージェント(ソフトウェアエージェントとその応用論文)
- SENSEVAL-2日本語タスク
- 機械翻訳の現状と課題(機械翻訳)
- 料理教示発話の理解と作業構造の自動抽出(特別セッション「言語理解と行動」(2))
- 料理教示発話の理解と作業構造の自動抽出(特別セッション : 言語理解と行動(2))
- 作業教示映像の構造的理解へ向けて(マルチメディアとパターン認識理解,一般)
- HTML文書集合からの評価文の自動収集
- Webテキストを対象とした語義曖昧性解消のための言語資源の半自動構築
- 語彙統語パターンにもとづく制約付き分布クラスタリング (「機械学習とその応用」および一般発表)
- 自動構築した評価文コーパスからの評価表現辞書の構築
- 依存構造を考慮した評価文書の分類(分類, ブログ)
- 迂言表現と重複表現の認識と言い換え
- マイクロブログ上の流言に対するユーザの態度の分類(テーマセッション,大規模マルチメディアデータを対象とした次世代検索およびマイニング)
- マイクロブログ上の流言に対するユーザの態度の分類(テーマセッション,大規模マルチメディアデータを対象とした次世代検索およびマイニング)
- 5L-4 単語の半教師ありクラスタリング(リーディングプロジェクト e-society:WebアーカイブとWebデータ解析技術,一般セッション,リーディングプロジェクト e-society)
- 言い換えと逆翻字を用いた片仮名複合名詞の分割
- 京都大学附属図書館における自動レファレンス・サービス・システム
- 時系列テキストを用いた恒久性と一意性に基づく関係の分類(自然言語処理,学生論文特集秀逸論文,学生論文)
- 対義形容詞対との相互情報量を利用した概念語の順序付け
- 聞き手の感情を喚起する発話の分類と生成(感情・評価・態度)
- 聞き手の感情を喚起する発話の分類と生成(感情・評価・態度)