收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

计算机辅助语言测试:效度分析

满朝辉  
【摘要】: 计算机已经广泛用于了教育的各个领域,包括教,学以及测试。在 语言测试方面,计算机的应用日趋广泛,并有逐步代替传统笔试的趋势。 随着计算机技术的日新月异的发展,可以用计算机进行测试的种类从最 初的客观题已经发展到听,说,读,写各个语言技巧方面的测试(见第 一章)。 所谓计算机辅助测试(CAT)指的是在过程的任何环节运用了计算 机技术的测试。就象任何新产生的事物一样,人们对计算机辅助测试的 信度(Reliability),效度(Validity)等方面依然存在着疑问。本文除了对计 算机辅助语言测试目前的所取得的进展以及今后的发展方向进行了全面 的描述以外,重点探讨了关于测试效度的几个问题。在讨论计算机辅助 语言测试的效度问题的时候,本文分两个章节分别对基于试题库的计算 机自适应性测试(CALT)和计算机化的现实性测试(Authentic Assessment)的效度进行了分析。 本文分由序言,第一章,第二章,第三章,第四章,结语六个部分 组成。 序言主要介绍了本文的研究方向,目的和文章结构。 第一章主要描述了目前计算机辅助语言测试所取得的进展和使用范 围。主要分四个方面进行了论述:试题库的建设;计算机辅助语言测试 可适用的测试种类;计算机自适应性语言测试以及计算机在语言测试中 运用的效果。 试题库建设包括生成,操作,分析,储存,管理,挑选试题的所有 过程。一个大的,科学管理的试题库是生成规范试卷的保证。一个小的 试题库可以用传统的方法,比如说文件卡片的方式进行管理。可是一个 容量的非常大的试题库就只能用计算机进行建设和分析,并且很多这方 面的软件己经问世,这样缸使得试题库处理更加简住和有效;用计算机 进行语言测试并不彤响测试的种类,在第一章的第二部分,本文总结了 计算机辅助语言测试的种类,并且分析了运用计算机进行测试的优势所 在:打破了传统测试集体性和限时性,达到了个别化测试和不限时测试, 是测试上的一次革命;接着第一章介绍了计算机辅助测试的一个很独特 并且得到最广泛运用的分支:计算机自适应性语言测试.和其他的语言 测试相比,它有以下几个特点:试题根据波测试者的不同而自行调节: 一旦棱测试者的实际水平被测出,测试自行停止;一般在曰目数虽上要 少于别的测试。计算机自适应性语言测试是基于项目反应理论mem ResOO’lseTheoryorIRT)的一种测试,已经被美国研究生人学考试 N桐沏te ReCOrd W or GRE和工商管理类研究生人学考试 (Gradua for Manapernent and Ad’llllllsthaon Tdor GMA)以及全美护 士国家委员会资格考试(NUrS Co’llllllltee Lcense Test or NNCL)等都已采取了CAT的方式。不难看出CAT代表了今后教育、 心理测验发展的方向与重点。第一章的第四部分从测试本身与人为因素 两个方面论述了计算机辅助语言测试的优势,接着从物理考虑和测试者 表现考虑论述了计算机输助语言测试存在的不足之处。 第二章专门对基于试题库的计算机自适应性语言测试的效度进行了 分析。首先给出了“试图库建设\“项目反应理论”和“效度”一些术 语的定义。然后对于影响计算机自适应性语言测试的几个主要因素进行 了讨论并一些解诀办法。这些因素主要包括:测试模式的变化,测试者 对计算机的戮悉程度的不同,计算机测试带来的紧张愚,速度的彤响, 题日顺序的变化,试卷长度的不同,测试者对出题方式的事先训练,和 试题库维度(碰mensiom山勺)的考虑。 计算机辅助语言测试除了机遇试题库的以外,还包括现实语言运用 的测试,主要指写作能力的测试。第三章就是通过一个实验对这种类型 测试的效度问题进行了分析。现在很多写作方面的测试仍然要求被测试 者用笔答的方式进行,但很多学生己经习惯了计算机上的写作,或者相 反的情况下,那么这种测试模式和练习模式的不同是不是会影响测试的 效度呢?这个问题争论已久。本文在这一章就以解放军外语学院98级英 语本科学员为对象,进行了一个实验。实验的假设是:测试模式的变化 对写作能力测试的结果有有意义的影响,而对客观题(这里采用的是阅 读理解的多项选择题)的影响却是可以忽略的。测试者以他们的专业四 级成绩和对计算机的熟悉程度(通过问卷和打字速度测试)分成实验组 和控制组,分别以笔答和上机的方式答同一份试卷,试卷包括二十道基 于短篇阅读理解的多项选择题和一道写作题,机上的部分采用了 AUTHQRWARE软件编写,在形式上尽量做到跟笔答试卷相同。两组的 作文都以文本方式进行打分,以避免打分者的偏见(bias)。最后对结果 进行了详细的数据分析,验证了假设。除此之外,还对写作题答案进行 了文本分析,发现计算机答题能产生较长的文本和相对多的段落,并且 通过性别分析,得出结论:计算机写作测试对女生的影响大于男生。这 个实验表明我们在评估学生写作能力的时候要考虑到测试模式与练习模 式不同对测试结果的影响,特别是当学生习惯笔试的情况下


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 倪凌;;试论高职英语测试中信度与效度的平衡[J];考试周刊;2011年43期
2 张翠玲;;中国翻译考试现状分析及反思[J];赤峰学院学报(科学教育版);2011年08期
3 付英;李鉴;;大学英语校内测试信度、效度分析[J];读与写(教育教学刊);2011年06期
4 刘静;;论高校口译测试中的核心问题[J];佳木斯教育学院学报;2011年04期
5 曲喻鹏;;试论语言测试对外语教学的反拨作用[J];吉林广播电视大学学报;2011年07期
6 颜桂;;影响学生评教效度的两种观念探析[J];当代教育论坛(管理研究);2011年09期
7 秦娟;唐振军;;高校网上评教的效度影响因素分析及对策[J];高教论坛;2011年10期
8 郜娜;;语言测试理论与大学英语测试[J];湖北广播电视大学学报;2011年07期
9 张宁娇;杜苗;;新四级听力测试对大学英语听力教学的反拨作用[J];首都师范大学学报(社会科学版);2010年S3期
10 郑向明;;浅议高中语文课堂有效提问应把握的“度”[J];中学语文;2011年18期
11 徐世红;;大规模语言测试的道德问题[J];南通大学学报(社会科学版);2011年04期
12 陈吉;;测验开发中的公平性审核探微——以美国ETS为例[J];现代教育论丛;2011年03期
13 吴琼;张秀红;;学术期刊编辑心理健康问卷的编制和信效度检验[J];大连大学学报;2011年03期
14 傅治夷;;论桂林市旅游景点翻译文本效度和信度的建设性理据[J];教育教学论坛;2011年26期
15 韩涛;;网络英语新闻标题文体特点及效度解读[J];新课程研究(中旬刊);2011年08期
16 张园园;曲庆梅;;高校教师运动友谊质量量表研究[J];滨州学院学报;2011年03期
17 夏船;;浅析信度与效度测量在大学英语测试中的应用[J];华章;2011年24期
18 温志;;论基于任务的高职英语测试改革[J];考试周刊;2011年56期
19 王佶旻;;初级汉语口语测验题型研究[J];考试研究;2011年05期
20 方秀才;;全国硕士研究生英语入学考试(NETEM)效度验证[J];淮北师范大学学报(哲学社会科学版);2011年03期
中国重要会议论文全文数据库 前10条
1 徐琳;梁孟华;;提高大学英语试卷信度和效度之我见[A];语言与文化研究(第五辑)[C];2010年
2 靖新巧;赵守盈;杨艳波;冯选洁;;多维尺度的效度和结构信度[A];第十一届全国心理学学术会议论文摘要集[C];2007年
3 徐卫卫;;对提高普通话水平测试信度与效度的思考[A];首届全国普通话水平测试学术研讨会论文集[C];2002年
4 苗丹民;刘旭峰;姜明;Rosina C. Chia;;MBTI人格类型量表的效度分析[A];第八届全国心理学学术会议文摘选集[C];1997年
5 王哲;胡随瑜;陈泽奇;陈珍贵;;简明抑郁症中医证候自评量表初步编制[A];第八次全国中西医结合精神疾病学术研讨会论文集[C];2005年
6 邓国峰;;利用网络进行心理测试的应用和相关问题研究[A];第十届全国心理学学术大会论文摘要集[C];2005年
7 乔晋;屈秋民;罗国刚;韩建峰;杨剑波;武成斌;张辉;张振馨;;帕金森病筛查量表效度及其分值分布特征分析[A];全面建设小康社会:中国科技工作者的历史责任——中国科协2003年学术年会论文集(下)[C];2003年
8 朱燕波;王琦;折笠秀树;;中医体质量表的信度和效度评价[A];2007中华中医药学会第五届全国中医体质学术研讨会论文集[C];2007年
9 冯辉;;积极完美主义量表的编制及与父母教养方式的相关研究[A];第十二届全国心理学学术大会论文摘要集[C];2009年
10 张阔;吴琼;;积极心理资源:测量及其与心理健康的关系[A];中国社会心理学会2008年全国学术大会论文摘要集[C];2008年
中国博士学位论文全文数据库 前10条
1 刘宝权;跨文化交际能力与语言测试的接口研究[D];上海外国语大学;2004年
2 张艳莉;建立一条龙英语测试体系[D];上海外国语大学;2004年
3 周世杰;儿童记忆成套测验的初步编制[D];中南大学;2002年
4 刘建华;美国跨国公司与“民主输出”研究[D];复旦大学;2007年
5 聂广宁;绝经综合征评定量表的研制与考评[D];广州中医药大学;2007年
6 郭新峰;中风病临床疗效评价指标体系的初步研究[D];广州中医药大学;2001年
7 黄云台;椎动脉型颈椎病量表的建立与临床观察评价[D];广州中医药大学;2006年
8 唐海波;大学生焦虑易感性—应激模型的实证研究[D];中南大学;2008年
9 向慧;心理治疗与咨询从业人员胜任特征模型研究[D];中南大学;2007年
10 李洋;上海社区居民体力活动评价研究[D];复旦大学;2004年
中国硕士学位论文全文数据库 前10条
1 张学珍;初中英语测试选择题型的利弊研究[D];东北师范大学;2008年
2 满朝辉;计算机辅助语言测试:效度分析[D];解放军外国语学院;2001年
3 赵红梅;语言测试与大学英语四级考试的评估[D];西南师范大学;2004年
4 梁佳;大学英语四、六级测试现状的理论分析与问题研究[D];湖南大学;2002年
5 路岱玲;校内英语水平测试效度实证研究[D];东北师范大学;2006年
6 刘金明;高中英语选项式完形填空题型中虚假分数对测试效度的影响[D];东北师范大学;2009年
7 李潇君;测试方法与英语诊断测试效度的相关性研究[D];东北师范大学;2006年
8 白璐;用统计手段分析英语试卷质量[D];大连海事大学;2007年
9 张冰;完形填空在语言测试中的测量能力研究[D];哈尔滨工程大学;2002年
10 陈颖;交际法英语听力测试和交际法英语听力教学的研究[D];福建师范大学;2005年
中国重要报纸全文数据库 前10条
1 本报记者 刘宁;英语学习:“应考”与“应用”的融合[N];中国教育报;2005年
2 商报记者 刘海颖;川大社力拓英语学术板块三大丛书唱主角[N];中国图书商报;2008年
3 王新科;学校思想政治教育应把握“五度”[N];衡阳日报;2005年
4 本报记者 孙弢实习生 魏连秀;留学生报名语言志愿者填补稀缺语种空白[N];北京日报;2007年
5 本报记者 马海伟;濮阳高考舞弊案的诸多疑问[N];中国商报;2004年
6 本报记者 李和裕;搭建桥梁“中间商”凸显不可或缺地位[N];上海证券报;2008年
7 刘宁;职业外语水平测试新“亮点”[N];中国教育报;2004年
8 本报记者 童光来;网上心理测试大多没信度[N];北京科技报;2004年
9 刘宝 胡善联;六大问题待解决[N];医药经济报;2002年
10 姜波;Linux加速,从桌面开始[N];网络世界;2006年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978