收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

若干标准设定方法的心理计量学比较初探

曹怡  
【摘要】: 标准设定是当代心理与教育测量学界中被公认为相当重要、且涉及面很广、争议很大、十分棘手的一个议题,涉及到测量学家、各学科领域专家、社会公众、相关决策者等方方面面的利益。由此,关于标准设定的研究层出不穷,而对于标准设定方法的比较研究更是其中的一大热点和难点。 本论文全面阐述了标准设定的定义、历史、模型和方法、国内外关于标准设定方法的比较研究等,并运用项目反应理论对1999年6月大学英语四级考试公开卷A卷部分试题进行了分析。在此基础上提出了两大研究目的。首要目的是从不同的心理计量学方面(与外在效标的一致性程度、项目反应理论的测量精度、概化理论的评分者一致性信度)比较三种标准设定方法:Nedelsky方法、Angoff方法和聚类分析结合受试者中心模型方法的优劣。另一目的是尝试使用判别分析之判别函数获得的权重结合传统的标准设定方法辅助成套测验的标准设定。为此,抽取了1649名受试者在1999年6月大学英语四级考试A卷部分试题的得分作为样本,并选取了5位熟悉大学英语四级教学大纲以及受试者基本知识和技能水平的专家参与标准设定。得到的主要研究结果如下: 1)1999年6月大学英语四级考试公开卷A卷是由较高质量的项目构成的,采用3PL拟合数据效果较好,大多数项目都具有较好的鉴别力和中等的难度水平。因此在其基础上进行标准设定,是完全可行并具有一定说服力的。 2)三种不同的标准设定方法产生的测验分界分数之间具有一定的差异。Nedelsky方法产生的测验分界分数显著高于Angoff方法产生的测验分界分数。 3)三种标准设定方法在三个不同的心理计量学方面各具优势:在与外在效标的一致性程度方面,聚类分析结合边缘组方法最好,Angoff方法次之,Nedelsky方法最差;在项目反应理论的测量精度方面,三种方法基本相同,Nedelsky方法最好,聚类分析结合边缘组方法最差;在概化理论的评分者一致性信度方面,Nedelsky方法和Angoff方法基本相同,Nedelsky方法略高。 4)在CET-4情境下,运用Nedelsky方法和Angoff方法,14位或以上专家人数为推荐的最佳专家人数方案。 5)通过判别分析得到CET-4三部分的权重中,听力理解部分被赋予的权重最大、阅读理解部分次之、词汇与语法结构部分最小。 6)加权情境下使用标准设定方法得到的测验分界分数较没有加权情境下得到的测验分界分数在与外在效标的一致性程度和评分者一致性信度两方面都有所提高,Angoff方法较Nedelsky方法提高得尤为明显。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 崔丽娟,赵鑫;用安戈夫(Angoff)方法对网络成瘾的标准设定[J];心理科学;2004年03期
2 胡英;;不要[J];中国校园文学;2008年19期
3 小丁;;人生中的“不要”[J];新一代;2008年02期
4 鹿士义;;商务汉语考试(BCT)与欧洲语言共同参考框架(CEFR)的等级标准关系研究[J];华文教学与研究;2011年02期
5 王小敏;论甘肃省普通话水平测试中的“标准设定”与“问题应对”[J];甘肃高师学报;2003年06期
6 胡英;;人生中的“不要”[J];时代青年(哲思);2007年08期
7 汪存友;余嘉元;;标准参照测验中标准设定的聚类分析法[J];南京师大学报(社会科学版);2010年01期
8 天舒;;人生中的“不要”[J];北方人(悦读);2008年02期
9 余嘉元;;主持人的话[J];南京师大学报(社会科学版);2010年01期
10 马剑虹;GUTTMAN量表的概率模型及其发展[J];心理发展与教育;1997年04期
11 王长生;刍议体育运动中心理健康的研究历程及标准设定[J];湖北体育科技;2001年02期
12 汪存友;余嘉元;;关于两种Angoff法比较的模拟实验研究[J];心理科学;2010年01期
13 柳佳,李锐红;智力研究和测量的现代历史和当前趋势[J];心理科学;1988年02期
14 李伟明;;重视对题目差异功能(DIF)的分析和研究[J];中国考试(高考版);1998年04期
15 王玲;沈政;樊春雷;;智力与心理速度的关系研究述评[J];心理科学进展;2006年01期
16 陈琦,D.B.Kaye,V.L.Bonnefil;论数学能力的研究与认知理论的关系[J];心理学报;1984年03期
17 崔丽娟;;用安戈夫方法对网络成瘾与网络游戏成瘾的界定[J];应用心理学;2006年02期
18 李飞;苏林雁;耿耀国;;Barratt冲动量表用于儿童的信度和效度初步研究[J];中国临床心理学杂志;2006年02期
19 李媛霞;;动态评价与新型大学英语教学评价体系的构建[J];大家;2011年16期
20 吴正,张厚粲;智力理论和智力测验的新发展[J];心理科学;1993年03期
中国重要会议论文全文数据库 前10条
1 卢晓玲;辛涛;;Angoff和Bookmark标准设定方法的比较研究[A];第十一届全国心理学学术会议论文摘要集[C];2007年
2 高文娟;;关于标准设定影响因素的相关研究[A];第十一届全国心理学学术会议论文摘要集[C];2007年
3 刘声涛;;认知诊断理论和技术新进展[A];第十届全国心理学学术大会论文摘要集[C];2005年
4 吕正;;对LED发光强度测量标准设定两种距离的质疑[A];海峡两岸第十三届照明科技与营销研讨会专题报告暨论文集[C];2006年
5 杨畅;;基于标杆管理的地方政府绩效评估系统创新研究[A];“落实科学发展观推进行政管理体制改革”研讨会暨中国行政管理学会2006年年会论文集[C];2006年
6 汪存友;余嘉元;吴慧红;田金亭;;一项关于两种Angoff法比较的模拟研究报告[A];全国教育与心理统计与测量学术年会暨第八届海峡两岸心理与教育测验学术研讨会论文摘要集[C];2008年
7 张莹;;浅析澳大利亚人才评价标准与方法[A];区域人才开发的理论与实践——港澳台大陆人才论坛暨2008年中华人力资源研究会年会论文集[C];2008年
8 李芝萍;;云南白药气雾剂用于Ⅰ期压疮的护理体会[A];中华护理学会全国中医、中西医结合护理学术交流暨专题讲座会议论文汇编[C];2009年
9 伍烽;;医学超声波生物学效应的研究-从诊断到治疗[A];2005年全国超声医学工程学术会议论文集[C];2005年
10 冷传慧;;农产品贸易中价值标准设定与量化的探讨——以日本水产品进口为例[A];2009’中国渔业经济专家论坛论文摘要集[C];2009年
中国博士学位论文全文数据库 前7条
1 方放;标准设定动因下高技术企业研发能力提升机理与评价研究[D];湖南大学;2009年
2 徐曾沧;WTO背景下技术标准中专利并入的法律问题研究[D];华东政法大学;2008年
3 朱建秋;基于移动通信标准的标准成功要因研究[D];北京邮电大学;2008年
4 崔丽娟;青少年网络成瘾的界定、特性与预防研究[D];华东师范大学;2005年
5 李晓霞;中国基层公务员素质建设研究[D];华东师范大学;2011年
6 雷忠;我国高校人才战略绩效评价研究[D];武汉理工大学;2011年
7 周瑜;制造企业双层动态成本控制研究[D];哈尔滨工程大学;2012年
中国硕士学位论文全文数据库 前10条
1 曹怡;若干标准设定方法的心理计量学比较初探[D];华东师范大学;2003年
2 赵鑫;青少年网络成瘾的标准设定及网络成瘾对青少年社会性发展的影响[D];华东师范大学;2004年
3 王博;论证券投资基金管理人的注意义务标准[D];华东政法大学;2008年
4 董传金;基于网络效应的产品竞争策略[D];山东理工大学;2008年
5 李雪梅;IRT框架下的多级评分模型的参数估计方法及其应用[D];东北师范大学;2007年
6 岳永宁;标准化中的垄断与反垄断问题研究[D];山西财经大学;2007年
7 高晶;大学英语学习者语音与听力理解之间相关性的实验研究[D];山东大学;2006年
8 茅丰;基于FPGA的出租车计费器设计[D];上海交通大学;2007年
9 潘丽雯;初中生自我强化构成要素及影响因素研究[D];华东师范大学;2007年
10 李峰;房地产企业营利模式研究[D];首都经济贸易大学;2004年
中国重要报纸全文数据库 前10条
1 郑晓颖;长春联通个性化服务惠及百姓[N];人民邮电;2006年
2 崔吕萍;银行网银客户争夺战升级[N];北京商报;2008年
3 通讯员 宗文记者 吴晓征;加快推进倒房重建工作 确保群众年前搬进新居[N];安徽日报;2007年
4 罗燕倩;中国百佳酒店揭晓[N];华东旅游报;2007年
5 刘雪梅;“中国造”——玉柴的理想[N];中国工业报;2004年
6 记者 高传立;培育壮大农业产业化龙头企业[N];徐州日报;2010年
7 胡健;公务员工资标准应与社会发展相符[N];工人日报;2005年
8 江苏省吴江市高级中学特级教师 凌龙华;洗课:让课堂洗尽铅华回归本真[N];中国教育报;2007年
9 记者  陶冶;改进数据安全规则拒绝信用卡欺诈[N];金融时报;2006年
10 杨森;齐鲁乙烯经济运行模式效益凸显[N];中国石化报;2009年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978