品詞の並びに関するヒューリスティックスを用いた日本語同語反復表現の検出
スポンサーリンク
概要
- 論文の詳細を見る
自然言語における修辞的表現の一種である「同語反復表現」を計算機で検出する一手法を提案する.同語反復表現とは,「彼は彼,私は私だ」や「建物という建物が倒壊した」のように,一文中で同じ語(反復語)が繰り返され,かつ表層的な処理では意味解析できない表現のことである.本稿で提案する手法は,形態素解析によって品詞の同定を行い,反復語とその周辺の単語の品詞の並びに関するテンプレートを学習データから予め人手で作成しておき,そのテンプレートとのマッチングによって,対象とする文から同語反復表現を検出するものである.新聞記事データを用いた予備的な実験では,本手法によって,80.6%の呼出率で検出できることが示された.
- 一般社団法人情報処理学会の論文
- 1995-11-17
著者
-
滝澤 修
同志社大学 工学部 知識工学科
-
井佐原 均
郵政省通信総合研究所関西先端研究センター知的機能研究室
-
滝澤 修
郵政省通信総合研究所
-
井佐原 均
郵政省 通信総合研究所 関西先端研究センター
-
井佐原 均
郵政省通信総合研究所
関連論文
- 音声言語関連大型プロジェクトの現状と将来
- 語音弁別の神経機構 : 失語症患者の研究から得られたもの
- 失語症例の音の分離能力(クリック音融合閾)と聴覚的言語理解の関係について
- 開発者の視点からの機械翻訳システムの技術的評価 : テストセットを用いた晶質評価法
- ドキュメントへのインフォメーションハイディング(インフォメーションハイディング)
- 名詞句「AのB」「AB」の用例を利用した換喩解析
- テキストにおける首尾一貫性(coherence)と文脈表現構造
- 実験的な知識に基づく文脈表現構造からの英語テキスト生成
- 機械翻訳システムCONTRASTにおける文脈情報の利用
- SOMを用いた日本語意味マップの自己組織化
- 日本語連体修飾要素の多義解消に関する語彙意味論的検討
- 意味ソートmsort : 意味的並べかえ手法による辞書の構築例とタグつきコーパスの作成例と情報提示システム例
- 格助詞と格解釈 : 「で」の議論を中心に
- 助詞「から」の意味分類と判定法
- N進木拡張LINGOLのユ-ティリティ関数について
- 最大エントロピーモデルに基づく形態素解析 : 未知語の問題の解決策
- 最大エントロピー法に基づくモデルを用いた日本語係り受け解析
- 文末から解析する統計的係り受け解析アルゴリズム
- MEによる日本語係り受け解析
- 話し言葉の接続詞「で」の特徴(自然言語)
- 表層表現に着目した自由回答アンケートの意図に基づく自動分類
- テキストコーパスの作成 : RWC, JEIDA, Orchid
- 科学技術振興調整費開放的融合研究推進制度 : (小特集:) : 大規模コーパスに基づく『話し言葉工学』の構築
- 科学技術振興調整費開放的融合研究推進制度による「話し言葉の言語的・パラ言語的構造の解明に基づく『話し言葉工学』の構築」プロジェクト
- 概念辞書を用いた日本語理解システムに関する研究
- Analysis and Semantic Representation in CONTRAST--A Context-based Machine Translation System (自然言語対話システムに関する研究)
- An Efficient KWIC System for Japanese Text
- 語義の特異性を利用した慣用表現の自動抽出
- 片方向の共起性による述語型定型表現の自動抽出
- コーパスからの付属語的表現の自動抽出
- 疑似Nグラムを用いた助詞的定型表現の自動抽出
- コーパスからの関係表現の自動抽出
- JEIDA機械翻訳システム評価基準(品質評価編) : 英日翻訳の品質評価項目の検討と評価用コーパスの作成
- 機械翻訳システム CONTRAST における概念表現
- 文脈情報翻駅システムCONTRAST (自然言語理解)
- 未定義語を含む文の多段階構文解析
- A Natural Language Processing System with a Large Vocabulary in Secondary Storage
- 二次記憶上の大規模語彙を用いる自然言語処理システム
- 文脈処理技術 (計算言語学)
- 日本語修辞表現の工学的解析 : 駄洒落・アイロニー・トートロジー
- 品詞の並びに関するヒューリスティックスを用いた日本語同語反復表現の検出
- RWCにおける分類コード付きテキストデータベースの開発
- IREX :情報検索、情報抽出コンテスト
- 漸進的自然言語理解と概念階層
- 日本人の乳幼児による非母国語音声の弁別能力に関する発達的変化 : アメリカ英語における/r/と/I/および/w/と/y/に関して
- アイロニー表現検出の一手法
- 対話のモデルに基づくアイロニーの一定式化
- アイロニー表現の収集と分析について
- 対話のモデルに基づくアイロニーの一定式化
- 文末表現に着目した自由回答アンケートの分類
- B-7-12 北海道稚内市における実験研究用高速ネットワークの構想について
- 日本語同語反復表現の検出手法について : トートロジー理解タイプの自動判別
- 位置情報と分野情報を用いた情報検索
- 最大エントロピーモデルと書き換え規則に基づく固有表現抽出
- 知的ニュースリーダが対象とする対話型ネットニュースの特徴
- 知的ニュースリーダにおける表層的話題関連性の抽出
- 皮肉発話における話者の心的状態と韻律の関係
- 自己知識へのアクセスにおける意識の関与について
- 重要文と要約の差異に基づく要約手法の調査
- 日本語駄洒落なぞなぞ生成システム"BOKE"
- 記述された「併置型駄酒落」の音素上の性質
- 含意発話から価値評価に関する発話者の信念を推定するモデルの提案
- 自動要約のための文重要度の比較
- An Approach to Abstract Generation
- 待遇表現の丁寧さの計算モデル
- 情報ハイウェイ時代のテキスト情報への知的アクセス ( 情報処理最前線)
- 連想型意味記憶モデルASM
- モジュール型ニューラルネットによる品詞タグ付け
- NLP2000-23 / NC2000-17 モジュール型ニューラルネットによる品詞の曖昧性解消
- NLP2000-23 / NC2000-17 モジュール型ニューラルネットによる品詞の曖昧性解消
- 機械学習を用いたタイ語の品詞タグづけ
- 英語を介した日中対訳辞書の自動構築
- 言い換えの統一的モデル : 尺度に基づく変形の利用
- ストラテジとしての待遇表現 : ブラウン・レビンソンの理論の実験心理学的検証
- 長さ可変文脈を用いたマルチニューロタガー
- 待遇表現の丁寧さの計算モデル : 語尾の付加による待遇値変化
- 長さ可変文脈によるタイ語コーパスの自動品詞タグづけ
- 日本語文と英語文における統語構造認識とマジカルナンバー7±2
- 用例ベースによるテンス・アスペクト・モダリティの日英翻訳
- 後方文脈を考慮した係り受けモデル
- ニューラルネットとルールベース手法を統合した品詞タグづけシステム
- コーパスからの語順の学習
- 統計的手法による換慮の解釈
- 統計的手法による換喩解析
- コーパスからの語順の学習
- 排反な規則を用いた文節まとめあげ
- 品詞自動タグづけシステム : 伸縮性入力ニューロタガー
- 用例ベースによるモダリティの日英翻訳
- 学習による文節まとめあげ : 決定木学習, 最大エントロピー法, 用例ベースによる手法と排反な規則を用いる新手法の比較