グラフカーネルを用いた非分かち書き文からの漸次的語彙知識獲得
スポンサーリンク
概要
- 論文の詳細を見る
Extraction of named entitiy classes and their relationships from large corpora often involves morphological analysis of target sentences and tends to suffer from out-of-vocabulary words. In this paper we propose a semantic category extraction algorithm called Monaka and its graph-based extention g-Monaka, both of which use character n-gram based patterns as context to directly extract semantically related instances from unsegmented Japanese text. These algorithms also use ``bidirectional adjacent constraints, which states that reliable instances should be placed in between reliable left and right context patterns, in order to improve proper segmentation. Monaka algorithms uses iterative induction of instaces and pattens similarly to the bootstrapping algorithm Espresso. The g-Monaka algorithm further formalizes the adjacency relation of character n-grams as a directed graph and applies von Neumann kernel and Laplacian kernel so that the negative effect of semantic draft, i.e., a phenomenon of semantically unrelated general instances being extracted, is reduced. The experiments show that g-Monaka substantially increases the performance of semantic category acquisition compared to conventional methods, including distributional similarity, bootstrapping-based Espresso, and its graph-based extension g-Espresso, in terms of F-value of the NE category task from unsegmented Japanese newspaper articles.
著者
関連論文
- シンポジウム リーガルXML
- 赤外線通信を用いた頑健なモバイルアドホックネットワーク構築手法
- 英日話し言葉翻訳のための漸新的文生成手法
- 自然言語処理の応用に基づく法令外国語訳支援(法情報学最前線)
- E_032 LSAに基づいた辞書語義文の用語自動生成(E分野:自然言語)
- E_030 日英翻訳における訳語統一支援システム(E分野:自然言語)
- E_018 法令改正文の形式化に基づく新法テキストの自動生成(E分野:自然言語)
- シソーラス自動構築におけるPLSIの利用(シソーラス・辞書)
- F-005 索引語ペアを用いた多言語シソーラスの自動構築(F.人工知能)
- 派生文法に基づく日本語動詞句のウイグル語への翻訳
- 派生文法による日本語形態素解析
- モバイルアドホックネットワークにおけるコミュニケーション支援手法
- D-8-19 選好付き知識に対する統合操作の形式化
- 英日話し言葉翻訳のための漸新的文生成手法
- NBL-Square NBL-Times 法令英訳における標準対訳辞書について
- 視点 日本法令翻訳システムの構想
- 主辞情報付き文脈自由文法に基づく漸進的な依存構造解析(自然言語処理)
- 確率文脈自由文法に基づく漸進的構文解析
- 多エージェント系自己認識論理の論理プログラムへの変換
- 音声対話コーパスの収集と利用 : より豊かな車内音声対話システムを目指して(音声言語インタフェースの実用化と音声言語対話への展開)
- 主辞情報付き文脈自由文法に基づく漸進的な依存構造解析アルゴリズム
- 漸増的に端末を認識するアドホックネットワーク構築手法の評価
- 2000-NL-137-12 / 2000-SLP-31-7 マルチドメイン音声対話システムの構築手法
- 2000-NL-137-12 / 2000-SLP-31-7 マルチドメイン音声対話システムの構築手法
- 漸進的構文解析における構文的曖昧性とその解消
- グラフカーネルを用いた非分かち書き文からの漸次的語彙知識獲得
- 2N-4 確率文脈自由文法を用いた漸進的構文解析における出力タイミング決定手法
- 2ZA-1 漸進的処理に基づく音声対話メールツールSync/Mailの評価(マルチモーダル,一般講演,インタフェース)
- 3N-2 文脈自由文法の変換に基づく漸進的な話し言葉翻訳手法
- Sync/Mail : 話し言葉の漸進的変換に基づく即時応答インタフェース
- Sync/Mail : 話し言葉の漸進的変換に基づく即時応答インタフェース
- Sync/Mail : 話し言葉の漸進的変換に基づく即時応答インタフェース
- 発話に即時応答可能なメールツールの提案
- デモ3 携帯情報端末間の情報共有を支援するモバイルエージェントシステム
- 1B-6 携帯情報端末間の情報共有を支援するモバイルエージェントシステム
- アドホックネットワークを実現するモバイルエージェントシステム
- 音声対話インターフェースを備えたた車内秘書システムの提案
- 導出原理を用いた多エージェント自己認識論理の決定手続きの効率化
- 導出原理を用いた多エージェント自己認識論理の決定手続きの効率化
- 複数発話の同時理解・生成に基づく車内秘書音声対応システムの提案 (テーマ:社会的相互行為研究と対話理解研究の接点を探る)
- マルチモーダル図形エディタのための漸進的な話し言葉処理手法(マルチモーダルIF (1),「マルチモーダルと音声HI」およびヒューマンインタフェース/音声言語情報処理一般)
- マルチモーダル図形エディタのための漸進的な話し言葉処理手法
- 日本法令外国語訳データベースシステムの設計と開発
- 同時通訳コーパスの設計と構築
- 主辞情報付き文脈自由文法に基づく漸進的な依存構造解析
- 法律文中における単語出現頻度の変化 : 法令テキストマイニングの一例(松浦好治教授退職記念論文集)