特徴的部分文字列と共起情報を用いた固有表現の詳細ラベル付与
スポンサーリンク
概要
- 論文の詳細を見る
本稿では,固有表現を従来のIREX定義よりも詳細に分類するタスクについて検討する.与えられた固有表現をあらかじめ設定したクラスに分類する問題に焦点をおき,文章中で共起する語および語彙大系のカテゴリ情報と,あるクラスに特徴的な,固有表現を構成する部分文字列を素性とする手法を提案する.この手法をblogおよびWeb新聞中の固有表現を対象として評価し,F値が0.67から0.72に向上することを確認した.また,クラス毎に素性の有効性を調査し,出現頻度の低い語を多く含むクラスで部分文字列素性が有効であり,固有表現の曖昧性が多いクラスで共起情報が有効であることを確認した.
- 2010-07-15
著者
-
菊井 玄一郎
日本電信電話株式会社 NTTサイバースペース研究所
-
菊井 玄一郎
日本電信電話(株)サイバースペース研究所
-
菊井 玄一郎
NTTサイバースペース研究所
-
小林 のぞみ
日本電信電話株式会社NTTサイバースペース研究所
-
松尾 義博
日本電信電話株式会社NTTサイバースペース研究所
-
菊井 玄一郎
日本電信電話株式会社nttサイバースペース研究所
関連論文
- 特徴的部分文字列と共起情報を用いた固有表現の詳細ラベル付与 (言語理解とコミュニケーション)
- 音声認識を用いたマルチメディアコンテンツのインデクシング
- コミュニケーション効率に基づく課題遂行型音声対話の評価(第8回音声言語シンポジウム)
- コミュニケーション効率に基づく課題遂行型音声対話の評価(Session-3 コミュニケーション・対話,第8回音声言語シンポジウム)
- トピックと属性を用いたブートストラップ法に基づく語彙獲得
- 特徴的部分文字列と共起情報を用いた固有表現の詳細ラベル付与
- 2000-DBS-122-47 構造化文書をランキング可能な全文検索システム
- DE2000-69 構造化文書をランキング可能な全文検索システム
- コミュニケーション効率に基づく課題遂行型音声対話の評価(Session-3 コミュニケーション・対話,第8回音声言語シンポジウム)
- コミュニケーション効率に基づく課題遂行型音声対話の評価
- ターム間の意味的関連性に基づくタームリストの翻訳多義解消
- 順序保存ダイジェスト法によるWebページ間の部分複製検出
- 文脈的素性を用いた固有表現間の関係性判定
- リッチアノテーション : 固有表現に焦点をあてた知識抽出の試み(情報抽出(テーマセッション2))
- リッチアノテーション : 固有表現に焦点をあてた知識抽出の試み(情報抽出(テーマセッション2))
- 3D-7 地理的距離と有名度を用いた地名の曖昧性解消(自然言語処理,一般セッション,人工知能と認知科学)
- Web2.0時代の名寄せを実現する国有表現グラウンデイング技術 (特集 ポータルサービスを支える自然言語処理技術)
- テキストからの知識抽出による新しいWeb情報アクセスに向けて (特集 ポータルサービスを支える自然言語処理技術)
- D-12-67 「領域抽出不要型文字認識」に基づく景観中単語認識(D-12. パターン認識・メディア理解, 情報・システム2)
- 大語彙連続音声認識を用いた音声・映像コンテンツのインデクシング
- クロス言語情報検索と多言語情報アクセスシステム (特集論文1 高度検索技術)
- 対訳関係のないコーパスからの複合名詞対訳表現の獲得
- 音声認識・言語処理の適用によるコンテンツ内容記述メタデータの生成 (特集 メタデータ応用サービスおよび関連技術の動向)
- Web上の口コミを分析する評判情報インデクシング技術 (特集 ポータルサービスを支える自然言語処理技術)
- 転移学習による抽出型要約の精度向上
- 転移学習による抽出型要約の精度向上
- 言語の壁を越えて文書を検索する : クロスランゲージ情報検索(マルチリンガル情報アクセス)
- 大規模データを対象とした文書情報集約データベースと評判分析サービスにおける検証(データ工学,Web情報システム)
- トピック情報を用いたブートストラップ法に基づく語彙獲得
- 語彙と文脈情報を用いた反義の詳細クラス分類
- Evaluative Text Summarization Model with Sentence Extraction and Ordering