多段階α-層別化方法のシミュレーションによる検証(テストと評価)
スポンサーリンク
概要
- 論文の詳細を見る
試験答案用紙に鉛筆などで解答を記入していくペーパー&ペンシル(P&P)という従来の試験方法にかわり, コンピュータを媒体とした試験(Computer-basedTesting, CBT)が普及し始めた.CBTは, コンピュータのマルチメディア機能を試験用の刺激として応用できる可能性がある.その意味で語学試験, コンピュータ技術などの検定テストなどのパーフォーマンスを重視した能力測定には極めて適している.CBTの一種にコンピュータ適応型テスト(Computerized Adaptive Testing, CAT)というものがある.CATでは, 各被験者の能力にあったテスト項目がそれらを蓄えている項目プールから選択され呈示される.いわゆるそれは被験者の能力のレベルによって, 独自のテストを仕立て着のようにつくるTailored Testingという考え方である.項目プールには実際のテスト項目とそれに付随する項目困難度や識別度などのパラメータがデータベースとして集められている.抽出される項目はそのパラメータによって候補にあがったものから単純サンプルとして抽出される.項目プールはシステムにひとつというのがもっとも単純な例である.しかしこのように統計的基準のみで, テスト項目の内容(Content)を無視して構築された項目プールは実際には役に立たない.またこのような項目プールのデザインはCBTで使われるテスト項目の効率的な利用にも関係する.統計的な項目プールのデザインについての研究にChang & Ying(1999)の多段階α-層別化方法(Multistage α-stratified medlod)がある.この方法においては, CATセッションの初期には項目識別力パラメータ(aパラメータ)の低い項目から選び, 能力推定値の誤差が低くなるにつれ, aパラメータの高い項目を選んでいく.これはセッション初期における推定値誤差の項目選定に対する影響を減らす利点がある.層別化はこのほかにも, 各層とそこに貯えられる項目数の制御を適切にすることで, 不均等な項目呈示(Item Exposure)の問題の解決策になりうる.本研究においては多段階α-層別化方法にのっとり, シミュレーションシステムを構築する.潜在特性値の推定誤差を, この方法が減らすことができるかを検証し, またその点における効率的な項目プールデザインを提言する.
- 日本行動計量学会の論文
著者
関連論文
- ICTの発展に伴うインストラクショナルデザインパラダイムの拡大に関する一考察 : 「学び」の構造に着目した学習理論との関連において
- eラーニングにおけるインストラクショナルデザインの構築とその問題点
- 学校教育におけるパフォーマンス評価モデルの実験的検討
- G10-5 多段階α-層別化方法のシミュレーションによる検証(一般セッション(G10) : テストと評価)(第30回日本行動計量学会大会発表一覧)
- 多段階α-層別化方法のシミュレーションによる検証(テストと評価)
- 選抜場面における評価 : その理想と現実
- 論理的思考の獲得を目的とした情報リテラシー教育の試み
- PA53 英語の比較変化の習得に関する一考察 : 語形変化クイズ結果の有向非巡回グラフによる表現(教授・学習,ポスター発表A)
- eラーニングにおける学習者の認知世界の変容に関する研究私論
- なぜeラーニングは「学ぶ」行為を満足させることができないのか
- 企業内教育におけるeラーニングの活用に関する実態調査 : 人事教育担当者に対するインタビュー調査に基づいて
- 企業内教育におけるeラーニングの活用 : 人事教育担当者に対するインタビュー調査に基づいて
- 今日のeラーニングにおけるInstructional Design(ID)の理論的再検討
- 全米学力調査(NAEP)の研究
- 評定者内の評定のばらつきが信頼性に及ぼす影響
- 口頭発表の評価における信頼性 : 一般化可能性理論を用いて
- PE064 Multiple Intelligencesに基づいたパフォーマンス評価に関する一考察 : Working Styleに注目して(ポスター発表E,研究発表)
- リスニングテストにおける拡張組合せ形式についての検討(教育)(第31回 日本行動計量学会大会発表一覧)
- リスニングテストにおける拡張組合せ形式についての検討