期刊库|学位论文库|会议论文库|飞度BOOK|站内搜索注册|充值中心|购买知网卡|送卡上门|帮助中心|
全文文献: “飞度BOOK”首届期刊庙会开幕啦!
做个飞度客,万千杂志,想看就看!
《解放军外国语学院》 2001年
加入收藏 获取最新

计算机辅助语言测试:效度分析

满朝辉  
【摘要】: 计算机已经广泛用于了教育的各个领域,包括教,学以及测试。在 语言测试方面,计算机的应用日趋广泛,并有逐步代替传统笔试的趋势。 随着计算机技术的日新月异的发展,可以用计算机进行测试的种类从最 初的客观题已经发展到听,说,读,写各个语言技巧方面的测试(见第 一章)。 所谓计算机辅助测试(CAT)指的是在过程的任何环节运用了计算 机技术的测试。就象任何新产生的事物一样,人们对计算机辅助测试的 信度(Reliability),效度(Validity)等方面依然存在着疑问。本文除了对计 算机辅助语言测试目前的所取得的进展以及今后的发展方向进行了全面 的描述以外,重点探讨了关于测试效度的几个问题。在讨论计算机辅助 语言测试的效度问题的时候,本文分两个章节分别对基于试题库的计算 机自适应性测试(CALT)和计算机化的现实性测试(Authentic Assessment)的效度进行了分析。 本文分由序言,第一章,第二章,第三章,第四章,结语六个部分 组成。 序言主要介绍了本文的研究方向,目的和文章结构。 第一章主要描述了目前计算机辅助语言测试所取得的进展和使用范 围。主要分四个方面进行了论述:试题库的建设;计算机辅助语言测试 可适用的测试种类;计算机自适应性语言测试以及计算机在语言测试中 运用的效果。 试题库建设包括生成,操作,分析,储存,管理,挑选试题的所有 过程。一个大的,科学管理的试题库是生成规范试卷的保证。一个小的 试题库可以用传统的方法,比如说文件卡片的方式进行管理。可是一个 容量的非常大的试题库就只能用计算机进行建设和分析,并且很多这方 面的软件己经问世,这样缸使得试题库处理更加简住和有效;用计算机 进行语言测试并不彤响测试的种类,在第一章的第二部分,本文总结了 计算机辅助语言测试的种类,并且分析了运用计算机进行测试的优势所 在:打破了传统测试集体性和限时性,达到了个别化测试和不限时测试, 是测试上的一次革命;接着第一章介绍了计算机辅助测试的一个很独特 并且得到最广泛运用的分支:计算机自适应性语言测试.和其他的语言 测试相比,它有以下几个特点:试题根据波测试者的不同而自行调节: 一旦棱测试者的实际水平被测出,测试自行停止;一般在曰目数虽上要 少于别的测试。计算机自适应性语言测试是基于项目反应理论mem ResOO’lseTheoryorIRT)的一种测试,已经被美国研究生人学考试 N桐沏te ReCOrd W or GRE和工商管理类研究生人学考试 (Gradua for Manapernent and Ad’llllllsthaon Tdor GMA)以及全美护 士国家委员会资格考试(NUrS Co’llllllltee Lcense Test or NNCL)等都已采取了CAT的方式。不难看出CAT代表了今后教育、 心理测验发展的方向与重点。第一章的第四部分从测试本身与人为因素 两个方面论述了计算机辅助语言测试的优势,接着从物理考虑和测试者 表现考虑论述了计算机输助语言测试存在的不足之处。 第二章专门对基于试题库的计算机自适应性语言测试的效度进行了 分析。首先给出了“试图库建设\“项目反应理论”和“效度”一些术 语的定义。然后对于影响计算机自适应性语言测试的几个主要因素进行 了讨论并一些解诀办法。这些因素主要包括:测试模式的变化,测试者 对计算机的戮悉程度的不同,计算机测试带来的紧张愚,速度的彤响, 题日顺序的变化,试卷长度的不同,测试者对出题方式的事先训练,和 试题库维度(碰mensiom山勺)的考虑。 计算机辅助语言测试除了机遇试题库的以外,还包括现实语言运用 的测试,主要指写作能力的测试。第三章就是通过一个实验对这种类型 测试的效度问题进行了分析。现在很多写作方面的测试仍然要求被测试 者用笔答的方式进行,但很多学生己经习惯了计算机上的写作,或者相 反的情况下,那么这种测试模式和练习模式的不同是不是会影响测试的 效度呢?这个问题争论已久。本文在这一章就以解放军外语学院98级英 语本科学员为对象,进行了一个实验。实验的假设是:测试模式的变化 对写作能力测试的结果有有意义的影响,而对客观题(这里采用的是阅 读理解的多项选择题)的影响却是可以忽略的。测试者以他们的专业四 级成绩和对计算机的熟悉程度(通过问卷和打字速度测试)分成实验组 和控制组,分别以笔答和上机的方式答同一份试卷,试卷包括二十道基 于短篇阅读理解的多项选择题和一道写作题,机上的部分采用了 AUTHQRWARE软件编写,在形式上尽量做到跟笔答试卷相同。两组的 作文都以文本方式进行打分,以避免打分者的偏见(bias)。最后对结果 进行了详细的数据分析,验证了假设。除此之外,还对写作题答案进行 了文本分析,发现计算机答题能产生较长的文本和相对多的段落,并且 通过性别分析,得出结论:计算机写作测试对女生的影响大于男生。这 个实验表明我们在评估学生写作能力的时候要考虑到测试模式与练习模 式不同对测试结果的影响,特别是当学生习惯笔试的情况下
【关键词】:
【学位授予单位】:解放军外国语学院
【学位级别】:硕士
【学位授予年份】:2001
【分类号】:G434;H319.3
【DOI】:CNKI:CDMD:2.2001.007253
【目录】:
  • INTRODUCTION10-12
  • CHAPTER 1: CURRENT STATE OF KNOWLEDGE ON COMPUTERS IN LANGUAGE TESTING12-34
  • 1.1 Item Banking13-16
  • 1.2. Computer-Assisted Language Testing16-21
  • 1.2.1. Types of Tests Possible with CAT18-21
  • 1.3. Computer-Adaptive Language Testing21-28
  • 1.3.1. IRT----Foundations of Computer-Adaptive Testing22-26
  • 1.3.2. F1exilevel Procedures26-28
  • 1.4. Effectiveness of Computers in Language Testing28-32
  • 1.4.1. Advantages28-30
  • 1.4.2. Disadvantages30-32
  • 1.5. Summary32-34
  • CHAPTER 2: VALIDATING AN ITEM BANK IN A COMPUTER-ASSISTED OR COMPUTER-ADAPTIVE TEST34-54
  • 2.1. The Characteristics of An Item Bank35-38
  • 2.2. Item Response Theory38-40
  • 2.3. What Is Intended By Use Of The Term ”Validity”?40-41
  • 2.4. Validational Concerns Associated With CAT Item Banking41-52
  • 2.4.1. Mode of Presentation41-42
  • 2.4.2. Differential Familiarity42-44
  • 2.4.3. Computer Anxiety44-45
  • 2.4.4. Speededness Inf1uences45-46
  • 2.4.5. Item-Sequencing Concerns46-47
  • 2.4.6. Test Length Concerns47-48
  • 2.4.7. Warm-up Effects48-49
  • 2.4.8. Mode1 Fit Concerns49-51
  • 2.4.9. Item Bank Dimensiona1ity51-52
  • 2.5. Implications For Second/Foreign Language Assessment52-54
  • CHAPTER 3: COMPUTERIZED LANGUAGE TESTING AND AUTHENTIC ASSESSMENT54-85
  • 3.1. Introduction54-58
  • 3.2. Background58-59
  • 3.3. Hypothesis59-60
  • 3.4. Study Design60-73
  • 3.4.1. Instruments61-71
  • 3.4.2. Sampling Method71-72
  • 3.4.3. Scoring72-73
  • 3.5. Results73-76
  • 3.5.1. Overall Results74-75
  • 3.5.2. Computer versus Paper--and--Pencil Results75-76
  • 3.6. Discussion76-85
  • CHAPTER 4: RUTURE DIRECTIONS:COMPUTER-ADAPTIVE LANGUAGE TESTING85-87
  • CONCLUSION87-89
  • BIBLIOGRAPHY:89-98
全文下载: CAJ格式
不支持迅雷等加速下载工具,请取消加速工具后下载
CAJViewer7.0阅读器支持所有CNKI文件格式,AdobeReader仅支持PDF格式

【相似文献】
中国期刊全文数据库 前10条
1 朱江;浅谈语言测试中的效度问题[J];长春理工大学学报(社会科学版);2003年01期
2 党明虎;论语言测试的科学性[J];宝鸡文理学院学报(社会科学版);1999年04期
3 赵红梅;关于语言测试现代化的思考[J];重庆工学院学报;2001年04期
4 汪先锋;从信度与效度的相互关系看语言测试的取向[J];株洲师范高等专科学校学报;2000年02期
5 柯贤兵;现代语言测试的效度应重于信度[J];咸宁学院学报;2003年05期
6 谭海涛;关于语言测试的几点思考[J];云南师范大学学报(对外汉语教学与研究版);2003年06期
7 田巧智;计算机在语言测试中的应用[J];长春师范学院学报;2005年02期
8 黄星;语言测试与外语教学关系之我见[J];吉林教育科学;1994年12期
9 李建华;效度在语言测试中的重要性[J];襄樊职业技术学院学报;2002年04期
10 张春莉,尹鸿涛;语言测试——大学英语教师的必修课[J];牡丹江教育学院学报;2004年05期
中国重要会议论文全文数据库 前10条
1 田巧智;;计算机在语言测试中的应用[A];全国大学英语教学改革暨网络环境下外语教学学术研讨会论文集[C];2004年
2 陈冰冰;;引领外语测试新方向:计算机化调适性语言测试[A];全国大学英语教学改革暨网络环境下外语教学学术研讨会论文集[C];2004年
3 陈冰冰;;计算机化调适性语言测试:引领外语测试新方向[A];全国大学英语教学改革暨网络环境下外语教学学术研讨会论文集[C];2004年
4 范文可;胡永善;吴毅;杨晓冰;;功能综合评定(FCA)量表效度的研究[A];第六次全国运动疗法学术会议论文集[C];2002年
5 刘晓康;;通过分级考试评析中国大学新生英语听力与阅读能力差异[A];福建省外国语文学会2006年年会暨学术研讨会论文集(下)[C];2006年
6 娄喜祥;;英语专业八级新旧版短文改错题的信度与效度研究[A];福建省外国语文学会2006年年会暨学术研讨会论文集(上)[C];2006年
7 刘鹏;黄东锋;江沁;;脑瘫患儿粗大运动功能测量(GMFM)量表的效度研究[A];继往开来 与时俱进——2003年康复医学发展论坛暨庆祝中国康复医学会成立20周年学术大会论文集[C];2003年
8 乔晋;屈秋民;罗国刚;韩建峰;杨剑波;武成斌;张辉;张振馨;;帕金森病筛查量表效度及其分值分布特征分析[A];全面建设小康社会:中国科技工作者的历史责任——中国科协2003年学术年会论文集(下)[C];2003年
9 李学武;刘子龙;高北陵;中文字词识别测验全国协作组;;中文字词识别测验的信度和效度[A];中华医学会精神病学分会第七届学术年会论文摘要集[C];2006年
10 苗丹民;刘旭峰;姜明;Rosina C. Chia;;MBTI人格类型量表的效度分析[A];第八届全国心理学学术会议文摘选集[C];1997年
中国重要报纸全文数据库 前10条
1 本报记者 刘宁;英语学习:“应考”与“应用”的融合[N];中国教育报;2005年
2 袁建胜;北京语言大学国际交流与合作成绩斐然[N];科学时报;2007年
3 商报记者 刘海颖;川大社力拓英语学术板块三大丛书唱主角[N];中国图书商报;2008年
4 本报记者 孙弢实习生 魏连秀;留学生报名语言志愿者填补稀缺语种空白[N];北京日报;2007年
5 本报记者 李和裕;搭建桥梁“中间商”凸显不可或缺地位[N];上海证券报;2008年
6 刘宁;职业外语水平测试新“亮点”[N];中国教育报;2004年
7 王新科;学校思想政治教育应把握“五度”[N];衡阳日报;2005年
8 ;考“托”考“G”没有捷径[N];福建日报;2002年
9 姜波;Linux加速,从桌面开始[N];网络世界;2006年
10 记者 陈枫 通讯员 温志勤;开颅时对谈保患者语言神经[N];南方日报;2006年
中国博士学位论文全文数据库 前10条
1 刘宝权;跨文化交际能力与语言测试的接口研究[D];上海外国语大学;2004年
2 张艳莉;建立一条龙英语测试体系[D];上海外国语大学;2004年
3 周世杰;儿童记忆成套测验的初步编制[D];中南大学;2002年
4 郭新峰;中风病临床疗效评价指标体系的初步研究[D];广州中医药大学;2001年
5 黄云台;椎动脉型颈椎病量表的建立与临床观察评价[D];广州中医药大学;2006年
6 吴亮锦;珠宝的知觉价值与购买意愿之研究[D];中国科学技术大学;2006年
7 李丽;小学生基本数学能力发展水平研究[D];华中科技大学;2005年
8 李洋;上海社区居民体力活动评价研究[D];复旦大学;2004年
9 谢小云;人力资源测评效标模型:效度概化的视角[D];浙江大学;2005年
10 项凤梅;建立艾滋病生存质量量表的临床研究[D];广州中医药大学;2005年
中国硕士学位论文全文数据库 前10条
1 满朝辉;计算机辅助语言测试:效度分析[D];解放军外国语学院;2001年
2 文华;计算机在语言测试中的应用[D];西安电子科技大学;2002年
3 曲鑫;计算机在语言测试中应用的研究[D];吉林大学;2004年
4 高淑玲;语言测试及其策略与大学英语教学[D];西北大学;2003年
5 汪望珠;语篇分析理论在语言测试中的运用[D];华中师范大学;2000年
6 王娟;江汉石油学院2001.1.99级大学英语期末考试综合评析[D];华中师范大学;2001年
7 张晓冬;第二语言习得与语言测试构建的接口[D];吉林大学;2005年
8 张冰;完形填空在语言测试中的测量能力研究[D];哈尔滨工程大学;2002年
9 陈颖;交际法英语听力测试和交际法英语听力教学的研究[D];福建师范大学;2005年
10 赵红梅;语言测试与大学英语四级考试的评估[D];西南师范大学;2004年
关于知网|版权声明|学术会议服务|广告服务|在线咨询
京ICP证040431号互联网出版许可证新出网证(京)字008号北京市公安局海淀分局备案号:110 1081725
订购咨询热线:800-810-6613、010-62985026免费送卡上门
主办:清华大学
数字出版:中国学术期刊电子杂志社
在线发行:同方知网(北京)技术有限公司
关 闭
关 闭
关 闭