Learning from Crowds and Experts
- 論文の詳細を見る
Crowdsourcing services are often used to collect a large amount of labeled data for machine learning. Although they provide us an easy way to get labels at very low cost in a short period, they have serious limitations. One of them is the variable quality of the crowd-generated data. There have been many attempts to increase the reliability of crowd-generated data and the quality of classifiers obtained from such data. However, in these problem settings, relatively few researchers have tried using expert-generated data to achieve further improvements. In this paper, we apply three models that deal with the problem of learning from crowds to this problem: a latent class model, a personal classifier model, and a data-dependent error model. We evaluate these methods against two baseline methods on a real data set to demonstrate the effectiveness of combining crowd-generated data and expert-generated data.
坪井 祐太
鹿島 久嗣
梶野 洸
佐藤 一誠
鹿島 久嗣
東京大学大学院 情報理工学系研究科
- 現場発想による自然言語処理ブレークスルーの探求(平成21年度論文賞の受賞論文紹介)
- 教師付き学習を用いた教師なし変化解析手法(知識獲得,機械学習,情報爆発論文)
- 部分的かつ曖昧なラベル付き構造データからのマルコフ条件付確率場の学習(情報抽出・ラベル付与)
- カーネル法に基づく構造データのラベル付け学習アルゴリズム(「自動推論:帰納,演繹,モデル検査/生成,学習,発見,仮説推論、論理プログラム,プランニングetc.」及び一般)
- グラフとネットワークの構造データマイニング
- 現場発想による自然言語処理ブレークスルーの探求
- 日本語単語分割の分野適応のための部分的アノテーションを用いた条件付き確率場の学習
- 赤穂昭太郎, カーネル多変量解析-非線形データ解析の新しい展開-, 岩波書店, 2008年
- ネットワークデータを用いた分散システムにおける異常検出(データマイニング,データ工学論文)
- 半構造データマイニング(semi-structured date mining)
- 動的計画法によるリターン分布推定(IBIS2010(情報論的学習理論ワークショップ))
- 頻出部分文字列のマイニング(抽出,マイニング)
- 頻出部分文字列のマイニング(抽出, マイニング)(言語理解とコミュニケーション)
- 頻出部分文字列のマイニング
- 異なるタイプのドキュメントに対する著者推定
- 点予測による自動単語分割
- 補助情報を用いたテンソル分解(主成分分析,テキスト・Webマイニング,一般)
- 潜在的トピックモデル(私のブックマーク)
- 部分パスに基づいた線形時間木カーネル(ポスターセッション,第14回情報論的学習理論ワークショップ)
- クラウドソーシングを用いた教師付き学習の凸最適化による定式化(ポスターセッション,第14回情報論的学習理論ワークショップ)
- カーネル法に基づく行列あるいはテンソル補完(ポスターセッション,第14回情報論的学習理論ワークショップ)
- 点予測による自動単語分割
- 部分パスに基づいた線形時間木カーネル
- 上位カテゴリにおける観測データが与えられる場合の行列およびテンソル分解法(行列分解,応用,統計推理,データベース,一般)
- クラウドソーシングを用いた教師付き学習の凸最適化による定式化
- Learning from Crowds and Experts
- 複数の関係データの関連を考慮した同時補完法(機械学習)
- ヒューマンコンピュテーション概説(ヒューマンコンピュテーションとクラウドソーシング)