プログラム評価のための最適項目応答モデルと等化方法の選択
スポンサーリンク
概要
- 論文の詳細を見る
This research aims for more valid and efficient in-house pre- and post-testing systems for program evaluation in university language programs. In order to avoid conducting two paper-and-pencil tests for over 5,000 students, about 14% of all students were given a post-test within a large university language program. As our first stage, we attempted to find the best fitting system to equate these pre- and post-tests data. Two IRT (Item Response Theory) models, a two parameter model (2PL), and a three parameter model (3PL) were chosen and combined with five different equating methods, these being mean-mean (MM), mean-sigma (MS), Haebara (HB), Stocking & Lord (SL), and CALR (CR). Eventually ten combinations of IRT model and equating methods were examined for evaluation. The best fitting one was found to be 2PL-CR, while the least fitting one was 3PL-MS. Afterward, the average gain in ability (θ) of about 700 students who took both tests was calculated with both the best and least fitting combinations. The largest difference in the average gain of θ between the two was θ=0.143. The results indicated that we need to keep applying 2PL-CR for accuracy and consistency so that we can compare the average gain of students' θ between two or more school years to monitor changes. As further evidence of program efficacy, regression analyses were run to look into the relationships between the gain of θ and the survey results of students' needs. This was done in order to reflect the voices of the students who gained more ability. The overall research results indicate that pre- and post-testing systems, when conducted appropriately, can yield reliable and efficient student evaluation data within large university language programs.
- 2012-11-15
著者
関連論文
- マルチレベルモデルにおける分散母数の階層化(多母集団同時分析とマルチレベル分析,日本行動計量学会 第38大会 抄録集)
- 統合型テストプラットフォームの開発(テストデータとテキストデータ,日本行動計量学会 第38大会 抄録集)
- 選抜場面における評価 : その理想と現実
- ベイズ推定による2相3元データの非計量多次元尺度構成法(セッション3B)
- 項目反応理論を用いた第1回共用試験医学系CBTの統計解析
- 人間関係における動態的相互作用の実験研究―動態的相互作用における個人特性の測定―
- 階層的線形モデルにおけるレベル1パラメータの推定精度について(数学・統計)
- G10-4 WebとSQL Serverを用いたCATシステムの開発(一般セッション(G10) : テストと評価)(第30回日本行動計量学会大会発表一覧)
- WebとSQL Serverを用いたCATシステムの開発(テストと評価)
- 計量的多次元展開法の新しい解法とその評価(多変量解析II)
- 大学入学者選抜に関する意見の構造 : 高校生,高校教員,大学教員の比較(教育)(第31回 日本行動計量学会大会発表一覧)
- G5-5 進学校における大学受験に関する意識と学内成績及び性別との関係(一般セッション(G5) : 人間科学)(第30回日本行動計量学会大会発表一覧)
- 大学入学者選抜に関する意見の構造 : 高校生、高校教員、大学教員の比較
- 潜在変数を含む場合の順序制約付きロジスティックモデル(セッション2A)
- 推移律を満たさない選択判断のモデル化(セッションN-3(MK301) 一般セッション マーケティング1)
- 潜在クラスを用いた「多次元」尺度構成法(潜在変数分析の発展)
- 多値項目反応モデルにより推定された特性値の簡便推定法について(教育)
- 行列演算ならびに総和記号演算のためのMathematicaパッケージの開発(データ解析ツール)
- 母集団分布として混合正規分布を仮定した場合の能力値分布のパラメタ推定法(テスト理論)
- 潜在クラスモデルによる対比較データの分析(ベイズアプローチ)
- 因子スコアや潜在変数得点を用いた構造方程式モデルの母数推定の偏りの解決
- 潜在変数得点の推定値を用いた構造方程式の母数の推定について(医学)(第31回 日本行動計量学会大会発表一覧)
- 潜在変数得点の推定値を用いた構造方程式の母数の推定について(構造方程式モデル)(第31回 日本行動計量学会大会発表一覧)
- テストの標準化について
- 潜在変数得点の推定値を用いた構造方程式の母数の推定について
- 進学校における大学受験に関する意識と学内成績及び性別との関係
- 進学校における大学受験に関する意識と学内成績及び性別との関係(人間科学)
- 項目反応理論によるテスト設計(日本行動計量学会活動報告)
- 資質評価と一体化した教職課程カリキュラムの再構築
- 次元縮約を伴うクラスタワイズ回帰分析(Session 4B)
- 倒産分析手法の比較分析(一般セッション 経営)
- プログラム評価のための最適項目応答モデルと等化方法の選択
- 変数クラスタリングを伴うクラスタワイズ回帰分析(一般セッション 数学・統計(5))
- PF028 正規分布の確率密度に比例した離散能力値分布の推定法(ポスター発表F,研究発表)