基于HSK数据对核等值法与其他等值策略比较探讨

更新时间：2024-01-31 点赞:5486 浏览:14562 作者：用户投稿原创标记本站原创

对测验的试卷进行等值具有重要的意义。等值处理可以提高测验分数报告和解释的精确性,保证评价标准的稳定性,从而保证测验的质量。核等值法(thekernelmethodoftestequating,KE)是一种新的等值方法。核等值法将基于经典测验理论(ClassicTestingTheory,CTT)的线性等值法和等百分位等值方法纳入到统一的框架之中。核等值法通过转换给定考生总体在X卷上的观察分分布,得到Y卷上的观察分分布,因此其本质是观察分等值。一般说来,核等值法有五个步骤,分别是前平滑处理、估计分数概率、连续化、等值、计算等值标准误。核等值法已经在美国教育测验服务中心(EducationalTestService,ETS)得到了应用。在试卷难度相近和考生样组水平相近的假设下,核等值框架下的新方法与CTT方法等值结果存在哪些差异?核等值法框架下的不同方法等值结果是否存在差异?差异程度如何?它是否可以用于HSK考试的等值?为了回答这些问题,本研究基于HSK考试,构建了虚拟的测验,在最大程度上消除误差,根据一定的等值标准,将核等值框架下的新方法与传统的CTT等值方法进行了对比。本研究比较的基于CTT的锚测验设计下的等值方法包括:Tucker、Levine、Braun-Holland、链式线性方法、经过及未经过平滑的链式频数估计等百分位方法、经过及未经过平滑的频数估计等百分位等值方法;基于核等值框架下的等值方法包括:核链式优化值等值法、核链式线性大h值方法、核后分层优化h值方法、核后分层大h值等值法。核框架下每种方法都包含平滑及未平滑两种处理。比较的结论是:在试卷难度有差异且考生样组水平也有差异情况下,在以随机组等百分位等值方法作为标准时,两种框架下的等百分位等值方法有较好的表现,但小样本上链式方法表现欠佳;核等值法与一些基于CTT的等值方法具有逐一|语文教学论文|对应的关系,线性方法无需进行平滑就可以得到与对应的传统线性方法相同的结果;核等值框架下大样本上核链式方法与核后分层方法、核链式等百分位方法与核链式线性方法、核后分层等百分位方法与核后分层线性方法之间都有较大差异;在小样本上,核链式方法与对应后分层方法、核链式等百分位方法与线性方法、核后分层等百分位方法与线性方法之间大部分时候差异较小,但是经过平滑后可能差异增大。由于现在的HSK考试比1989年时的考试难度大而且考生水平也提高了,因此当样本较小时,可采用CTT框架下经过平滑的频数估计等百分位方法或者核框架下经过平滑的核后分优化h值方法,避免使用链式方法;当样本较大时,可采用的方法有:CTT框架下频数估计等百分位方法以及链式等百分位方法、核框架下的核后分层优化h值方法以及链式优化h值方法。研究还讨论了不同的等值标准和统计指标。根据这些不同的标准,等值方法的比较得到了不同的结论。【关键词】：测验等值核等值经典测验理论教育丈量|教学论文网|汉语水平考试
【论文提纲】：摘要4-6Abstract6-8目录8-12表格目录12-16图表目录16-191研究背景、目的及意义19-222文献综述22-422.1关于等值的基本理论22-332.1.1等值的5个性质(或要求)22-252.1.2连接、猜测、量表化和等值25-282.1.3数据收集设计和等值方法28-332.2国外有关等值研究的综述33-392.2.1等值和测验开发332.2.2等值中的数据收集设计以及样本33-342.2.3等值方法的选择34-352.2.4从等值结果中选择35-372.2.5标准化条件和质量控制程序与等值的关系37-382.2.6基于计算机测验的等值问题38-392.3我国的等值研究综述39-412.4对目前研究的评价41-423有关核等值法的研究42-533.1核等值法研究的缘起423.2核等值法概要42-443.3核等值法的步骤44-473.3.1对目标总体进行前平滑处理443.3.2估计目标总体上的分数分布概率44-453.3.3将离散的分数分布连续化45-463.3.4计算和分析等值函数46-473.3.5计算等值标准误及相关的精度丈量|教学论文网|473.4核等值法与其他等值方法47-503.4.1核等值法与线性等值法48-493.4.2核等值法与等百分位等值法49-503.5ETS的实证研究50-513.6对核等值法的评价51-534HSK考试的情况以及研究目标和内容53-644.1关于HSK初中等考试的情况534.2研究假设、目标和内容53-554.3研究方法55-564.3.1数据收集设计554.3.2所比较的等值方法55-564.4实验数据56-644.4.1试卷的构建56-574.4.2考生总体的构建57-584.4.3比较的标准58-604.4.4比较的步骤60-645研究过程和结果64-1085.1试卷拆分后的主要统计数据64-695.1.1标准卷样组Q的试卷QYA以及锚测验QA统计数据64-655.1.2新卷样组P的试卷PXA及锚测验PA的统计数据65-665.1.3总体T标准卷TYA、新卷TXA及锚测验TA统计数据66-695.2前平滑处理的结果69-715.2.1标准卷和新卷数据前平滑处理结果695.2.2等值标准:总体T各分测验的前平滑处理69-715.3等值标准的计算结果715.4各种等值方法在各分测验上的等值结果715.5总误差指标的比较71-795.5.1不同等值标准下分测验总误差比较72-755.5.2总测验以四种等值方法为等值标准的加权总误差排名结果75-795.6核等值法与基于CTT的对应等值方法成对比较79-855.6.1核链式优化h值方法与基于CTT的链式等百分位方法79-805.6.2核后分层优化h值方法与基于CTT的频数估计等百分位方法80-825.6.3核链式大h值方法与基于CTT的链式线性方法82-835.6.4核后分层大h值方法与三种基于CTT的线性方法83-855.7核等值框架下各种方法等值结果比较85-1045.7.1核等值框架下链式方法结果比较86-875.7.2核等值框架下后分层方法结果比较87-895.7.3核等值框架下链式方法与后分层方法结果成对比较89-945.7.4核等值框架下优化h值及大h值方法等值结果成对比较94-995.7.5核等值框架下平滑与未平滑等值结果成对比较99-1045.8部分等值方法在各分测验上的等值标准误均值比较104-1055.9各等值方法在分测验上的等值分统计指标105-1086稳定性检验108-1446.1小样本试卷拆分后的主要统计数据108-1106.1.1小样本标准卷统计数据108-1096.1.2小样本新卷统计数据109-1106.2总误差指标的比较110-1186.2.1不同等值标准下分测验总误差比较110-1136.2.2总测验以四种等值方法为等值标准的加权总误差排名结果113-1186.3核等值法与基于CTT的对应等值方法成对比较118-1246.3.1核链式优化h值方法与基于CTT的链式等百分位方法118-1196.3.2核后分层优化h值方法与基于CTT的频数估计等百分位方法119-1216.3.3核链式大h值方法与基于CTT的链式线性方法121-1226.3.4核后分层大h值方法与三种基于CTT的线性方法122-1246.4核等值框架下各种方法等值结果比较124-1406.4.1核等值框架下链式方法结果比较124-1256.4.2核等值框架下后分层方法结果比较125-1276.4.3核等值框架下链式方法与后分层方法结果成对比较127-1316.4.4核等值法框架下优化h值及大h方法等值结果成对比较131-1366.4.5核等值框架下平滑与未平滑等值结果成对比较136-1406.5部分等值方法在各分测验上的等值标准误均值比较140-1416.6各等值方法在小样天职测验上的等值分统计指标141-1447讨论144-1557.1等值所依据的定义问题1447.2等值必要性问题1447.3等值标准的确定144-1467.4比较结果146-1487.4.1与等值标准比较的结果146-1477.4.2等值标准误指标比较情况1477.4.3等值分数分布统计指标147-1487.5核等值方法与基于CTT等值方法的成对比较1487.6核等值框架下各种等值方法的成对比较148-1507.7与以前的等值研究一致性问题150-1537.8关于HSK等值采用核等值法的建议1537.9本研究的创新1537.10本研究的不足以及有待于进一步研究的问题153-1558结论155-1579参考文献157-168致谢168