職業・産業コーディング自動化システムの活用
スポンサーリンク
概要
- 論文の詳細を見る
社会調査において職業や産業は重要な変数であるが、自由回答を含む複数のデータとして収集するためにアフターコーディングが必要で、作業量の多さや煩雑さが大きな問題となる。また、そのためにコーディングの結果が一貫しないという問題も存在するため、コンピュータによる有効な支援策として格フレームの概念に基づいたコーディングの自動化システムを提案し実験を重ねてきた。今回、システムを実際に2つの調査(「健康と階層」調査と「JGSS-2000(日本版General Social Surveys第1回本調査)」)における職業(6種類)と産業(4種類)データのコーディングに活用したので、その結果について報告する。システムの精度と再現率は、職業コーディングでは75%〜85%と60%〜70%で、人手と比較すると精度がやや高く再現率が低かった。また、システムと人手との一致率は約60%であった。産業コーディングの精度と再現率は90%〜95%と70%〜75%で、職業より高い数値を示した。今後、システムのもつ職業・産業辞書やシソーラスとJUMANの形態素辞書を改良することにより性能の向上が期待できるが、システムの使いやすさについての検討も必要である。
- 一般社団法人情報処理学会の論文
- 2002-01-21
著者
関連論文
- 複数の分類スコアを用いたクラス所属確率の推定
- 素性選択によるアンサンブル学習に関する一考察(機械学習・応用)
- 分類スコアに基づいたクラス事後確率の推定(コーパス, 学習, 対話, 要約)
- 機械学習とルールベースの組み合わせによる自動職業コーディング
- ルールベース手法と機械学習による自由回答の分類 : 職業コーディング自動化の方法(非定型データ分析の可能性)
- 機械学習とルールベースによる職業コーディング(テキスト検索,分類)
- 職業・産業コーディング自動化システムの活用
- 3. 自由回答データの分析 : 格フレームによる産業・職業コーディング自動化システムを中心として : 第68回 行動計量シンポジウム (日本行動計量学会活動報告)
- 格フレームによる自由回答のコーディング自動化 : 職業コーディングの自動化システム
- 格フレームによる自由回答のコーディング自動化システム
- 格フレームによる自由回答のコーディング自動化システム
- 格フレームによる自由回答のコーディング自動化システム
- コンピュータによる自由回答の処理方法
- S9-2 自然言語処理によるSSM職業コーディング・システムについて
- 自由回答法における構造化支援システムの開発について
- 質的デ-タの解析に関する一考察--政治意識調査における自由回答法の分析
- 多クラスSVMにおけるクラス所属確率を用いたアンサンブル学習の提案
- 多クラスSVMにおけるクラス所属確率を用いたアンサンブル学習の提案
- 職業コーディング支援システム(NANACO)の開発とJGSS-2003における適用