MapReduceによる類似フレーズクラスタリング
スポンサーリンク
概要
- 論文の詳細を見る
言語表現の多様性から,二つの語間の表層的な不一致は必ずしも意味的な不一致を意味しない.たとえば,carとautomobileは表層的には異なるものの,いずれも自動車を意味する.複数の語からなる句(フレーズ)の場合,表層と意味の不一致はさらに増加する.表層的に異なるフレーズ間の意味的な一致を判定することは,談話理解・生成においてきわめて重要である.本研究では,大規模なコーパスから抽出した大量のフレーズとその周辺文脈を基に階層的なクラスタリングを行うことで,意味的に類似したフレーズを同定する.また,大規模データに対応するため,MapReduceプログラミングモデルに適した効率的なクラスタリングアルゴリズムを提案する.
- 一般社団法人情報処理学会の論文
- 2012-03-06
著者
関連論文
- 実空間検索メタデータとしてのソーシャルメディア (ライフインテリジェンスとオフィス情報システム)
- 原言語音韻を考慮した多様なカタカナ異表記生成モデル
- 英音素変換を用いたカタカナ異表記の自動生成(機械翻訳・医療情報)
- 主観的トリガー言語モデルによる意見情報検索
- 相同遺伝子を考慮したGOアノテーションへの多階層分類の適用
- 主観的トリガー言語モデルによる意見情報検索
- 相同遺伝子を考慮したGOアノテーションへの多階層分類の適用
- 相同分子種を利用した多階層分類による遺伝子機能アノテーション(セッション6b:アプリケーション)
- 主観的トリガー言語モデルによる意見情報検索
- 実空間検索メタデータとしてのソーシャルメディア(ログ活用・情報検索,ライフログ活用技術,グループウェアとネットワーク,一般)