MapReduceによる類似フレーズクラスタリング
スポンサーリンク
概要
- 論文の詳細を見る
言語表現の多様性から,二つの語間の表層的な不一致は必ずしも意味的な不一致を意味しない.たとえば,carとautomobileは表層的には異なるものの,いずれも自動車を意味する.複数の語からなる句(フレーズ)の場合,表層と意味の不一致はさらに増加する.表層的に異なるフレーズ間の意味的な一致を判定することは,談話理解・生成においてきわめて重要である.本研究では,大規模なコーパスから抽出した大量のフレーズとその周辺文脈を基に階層的なクラスタリングを行うことで,意味的に類似したフレーズを同定する.また,大規模データに対応するため,MapReduceプログラミングモデルに適した効率的なクラスタリングアルゴリズムを提案する.
- 一般社団法人情報処理学会の論文
- 2012-03-06
著者
関連論文
- 実空間検索メタデータとしてのソーシャルメディア (ライフインテリジェンスとオフィス情報システム)
- 原言語音韻を考慮した多様なカタカナ異表記生成モデル
- 英音素変換を用いたカタカナ異表記の自動生成(機械翻訳・医療情報)
- 主観的トリガー言語モデルによる意見情報検索
- 相同遺伝子を考慮したGOアノテーションへの多階層分類の適用
- 主観的トリガー言語モデルによる意見情報検索
- 相同遺伝子を考慮したGOアノテーションへの多階層分類の適用
- 相同分子種を利用した多階層分類による遺伝子機能アノテーション(セッション6b:アプリケーション)
- 主観的トリガー言語モデルによる意見情報検索
- 実空間検索メタデータとしてのソーシャルメディア(ログ活用・情報検索,ライフログ活用技術,グループウェアとネットワーク,一般)
- リンク構造とコンテンツを複合的に用いた極少訓練事例によるスプログ検出
- 発想を支援するユーザエージェント(学習・開発支援,ライフログ活用技術,グループウェアとネットワーク,一般)
- 英語音韻を考慮した情報検索のための多様なカタカナ異表記生成
- 多様な遺伝子名認識と文書分類を用いたGene Ontologyアノテーション(パターン認識)
- マイクロブログを用いた感染症サーベイランス
- マイクロブログを用いた感染症サーベイランス
- 文献情報を用いたカーネル法による遺伝子機能アノテーション
- ネットワークの構造解析に基づく有望ノードの同定
- 生物医学要素関係間の意味的類似度に基づく仮説の順位付け
- 頑健なスパースカーネル分類器の学習
- 頑健なスパースカーネル分類器の学習
- 生物医学文献検索におけるソーシャルタグと統制語彙との比較(Web・データベース,第2回集合知シンポジウム)
- 株価回帰とWEBニュース記事分析を組み合わせた株価動向推定 (音声)
- 株価回帰とWEBニュース記事分析を組み合わせた株価動向推定 (パターン認識・メディア理解)
- 文献情報を用いたカーネル法による遺伝子機能アノテーション (数理モデル化と応用 Vol.4 No.4)
- Learning Non-Linear Classifiers with a Sparsity Upper-Bound via Efficient Model Selection (情報論的学習理論と機械学習)
- D-20-6 異種検索モデルの統合によるプログフィード検索(D-20.情報論的学習理論と機械学習,一般セッション)
- D-5-5 Learning to rank for real-time microblog retrieval
- カテゴリ階層を考慮した構造化パーセプトロンによる固有表現抽出
- カテゴリ階層を考慮した構造化パーセプトロンによる固有表現抽出
- 株価回帰とWEBニュース記事分析を組み合わせた株価動向推定(一般セッション,時系列パターン認識)
- 株価回帰とWEBニュース記事分析を組み合わせた株価動向推定(一般セッション,時系列パターン認識)
- マイクロブログ検索のための時間情報と非時間情報を統合したクエリ拡張
- マイクロブログ文書の選択による擬似適合フィードバック
- マイクロブログ文書の選択による擬似適合フィードバック
- 効率的モデル選択によるスパース性の上限を用いた非線形分類器の学習(機械学習一般とその応用)
- カテゴリ階層を考慮した構造化パーセプトロンによる固有表現抽出
- 三段論法的パターンに着目した解釈容易な仮説の生成規則獲得と順位付け
- 異なる述語項関係に基づく階層的フレーズクラスタリング(言語における美の表現)
- マイクロブログ文書の選択による適合フィードバックを用いた疑似適合フィードバックの検索性能改善
- マイクロブログ文書の選択による擬似適合フィードバック(一般講演,情報検索(2),ビッグデータを対象とした管理・情報検索・知識獲得及び一般)
- コンセプト追跡を用いたマイクロブログ検索
- カテゴリ階層を考慮した固有表現抽出
- MapReduceによる類似フレーズクラスタリング