係り受け関係を考慮したテキストマイニングのための半構造マイニング手法の提案(言語処理,夏のデータベースワークショップDBWS 2006)
スポンサーリンク
概要
- 論文の詳細を見る
テキストマイニングにおいて,文章中の単語の出現頻度は重要な要素を占めている.また、単語間の関係性を抽出する場合,単なる共起関係だけではなく、係り受け関係のような文が持つ意味構造を含めた関係性も重要視されている。本研究では、テキストデータから頻出な係り受け関係をもつ単語集合を抽出する手法を提案する。特に、シーケンスを節点とする木構造として係り受け関係を表現し、そのマイニング手法を提案することで,従来の半構造マイニング手法では抽出できないパターンの抽出を可能とした。
- 一般社団法人情報処理学会の論文
- 2006-07-13
著者
関連論文
- 〈情報処理学会 情報学基礎研究会 (F1) 第96回 発表論文〉 接尾辞配列とディリクレ過程混合モデルを用いたテキスト中の数値表現マイニング (筑波大学東京キャンパス(秋葉原地区). 2009年11月19日)
- 25aQL-9 量子アニーリング法を用いた変分ベイズ推定(情報統計力学,領域11,統計力学,物性基礎論,応用数学,力学,流体物理)
- 異なる発信元からのWWWニュース記事の内容に基づく対応付け
- 接尾辞配列とディリクレ過程混合モデルを用いたテキスト中の数値表現マイニング
- Latent Dirichlet Allocationにおける決定論的オンラインベイズ学習
- Web上の人名検索結果の同姓同名問題における二段階クラスタリングを用いた再現率向上
- Web上の人名検索結果の同姓同名問題における二段階クラスタリングを用いた再現率向上
- 連接異なり語数による専門用語抽出
- 連接異なり語数による専門用語抽出
- 半構造データマイニング(semi-structured date mining)
- Wikipedia を介した関連ニュース・ブログの対応付け : Wikipedia エントリの分析
- 6ZC-1 半教師有り学習に基づくWeb上の人物クラスタリングシステム(情報爆発時代におけるWebパーティカル検索,学生セッション,「情報爆発」時代に向けた新IT基盤技術,情報処理学会創立50周年記念(第72回)全国大会)
- web検索に基づく多言語動的KWIC
- 階層Pitman-Yorトピックモデル(一般講演(学習の理論),機械学習とその応用)
- Succinct semi-structured data mining based on FREQT
- SPAアルゴリズムの半教師あり学習への応用
- SPAアルゴリズムの半教師あり学習への応用
- Latent Dirichlet Allocation における決定論的オンラインベイズ学習
- 無限混合Dirichletトピックモデル (「学習」および一般発表)
- Dirichlet Process Unigram Mixture Modelに対するCollapsed Variational Bayes Inferenceの適用
- Dirichlet Process Unigram Mixture Modelに対するCollapsed Variational Bayes inferenceの適用(セッション2)
- 係り受け関係を考慮したテキストマイニングのための半構造マイニング手法の提案(言語処理,夏のデータベースワークショップDBWS 2006)
- 係り受け関係を考慮したテキストマイニングのための半構造マイニング手法の提案(言語処理)
- 係り受け関係を考慮したテキストマイニングのための半構造マイニング手法の提案
- 長時間テレビドラマのシナリオと音声トラックの時間対応付け
- 多様な携帯端末に適応可能なコンテンツ中間記述
- 多種の表示デバイスへ適応可能なコンテンツ中間表現形式の提案
- 多種の表示デバイスへ適応可能なコンテンツ中間表現形式の提案
- Comparable corpusから得られた対訳単語の曖昧性解消
- 意味保存型の情報ハイディング : 日本語文書への適用
- 意味保存型の情報ハイディング : 日本語文書への適用
- 量子アニーリングによる無限混合モデルの並列最適化(機械学習とその応用)
- ロックアップ期間による制約を考慮した確率的バンディット問題
- ロックアップ期間による制約を考慮した確率的バンディット問題
- 3次元Haar特徴量を用いたハンドジェスチャー認識
- ソーシャルメディアからの地域固有表現の抽出(地域情報&ソーシヤルメデイア,第4回集合知シンポジウム)