レシピのテキスト及び画像特徴の学習による画像からの素材・調理法の推定(一般セッション,機械学習と視覚情報処理の接点,及び,社会テーマ:ハイリスク作業支援)

概要

論文の詳細を見る
料理レシピから抽出したテキスト特徴と画像特徴を同時に学習しモデル化することによって、料理画像の入力に対し素材や調理法を推定する手法を提案する.料理のジャンルを潜在的な変数として考慮するため, 文書解析に用いられるトピックモデルの一つであるLDA (Latent Dirichlet Allocation)を適用し,個々のレシピをドキュメント,そのレシピから抽出される特徴ベクトルをワードとしてパラメータの推定を行いモデルを生成する.特徴ベクトルとして,部分画像単位で求めた局所特徴と色ヒストグラムに基づく画像特徴,およびテキストの形態素解析により抽出した単語とをそれぞれシンボル列として結合し同時に学習することで,それらの共起性の高いシンボルを含むトピック群が生成される.4600レシピの画像とテキストの料理名部分に含まれる単語の学習によってモデルを生成したところ,料理のジャンルに関連すると思われるトピックが観察された.このモデルを用いて料理のジャンル(トピック)と単語の推定実験を行った結果,新たな100件のレシピの画像の入力に対して,約80件についてジャンルを正しく推定し,46レシピについては上位10位以内に実際の料理名中の素材や調理を示す単語が含まれており,今後,栄養推定に応用できる可能性が示唆された.
一般社団法人電子情報通信学会の論文
2013-08-26

レシピのテキスト及び画像特徴の学習による画像からの素材・調理法の推定(一般セッション,機械学習と視覚情報処理の接点,及び,社会テーマ:ハイリスク作業支援)

スポンサーリンク

概要

著者

関連論文

スポンサーリンク