初中英语口语测试信度的概化理论应用研究

时间:2022-09-03 13:17:12 阅读:

查阅相关文献,我们发现,关于初中英语口语测试的研究并不算少,但在评分标准信度方面,现有研究大多采用传统的经典测量理论。本研究采用实验法,编制了英语口语测试的评分标准,并以65名初二学生为样本获得其英语口语测试成绩,应用概化理论对该评分标准及评分者信度等进行分析。首先,查找文献,依据相关理论编制符合新课程标准要求的英语口语测试评分标准;...

关于义务教育阶段英语学习对青少年发展的重要性,我国新课程标准有非常详尽的阐述,并且提出了“通过英语学习,培养学生的英语语言的综合应用能力,促进心智发展,提高人文素养”的总目标。为了实现这一目标,新课程标准对于英语教学评价也给出了指导意见:“终结性的评价应采取口试、笔试和听力相结合的形式,全面考察学生的综合语言运用能力。”

然而,教学实践中,受评分标准的可信度、操作的复杂性、考试的成本较高等影响,一直以来,义务教育阶段英语口语测试的普及程度远不如纸笔测试,这必然会影响学生语言综合能力的全面发展。查阅相关文献,我们发现,关于初中英语口语测试的研究并不算少,但在评分标准信度方面,现有研究大多采用传统的经典测量理论。英语口语测试是一种行为观察测量,对评分者的依赖性较强,而且评分标准的科学性、评委的数量、试题的形式以及彼此之间的交互作用都会给测试结果带来一定的误差,这些误差用传统的经典测量理论是无法有效评估的。概化理论在解决这类以行为观察为主要评估方式的测试的信度问题方面,有着经典测量理论所无法比拟的优势。

概化理论(Generalizability Theory)是一种评估行为测量信度的统计学理论。这种理论的提出,源于人们认识到传统的经典测量理论没有对造成误差的各种来源进行区分,从而给出的测量结果过于粗糙。不同于经典测量理论,概化理论可以将测量中的系统误差和非系统误差加以区分并对各个变量分别估计。相对于经典测量理论对平行测验中假设上的苛刻要求,概化理论仅假设平行测验是从相同的全域中随机抽样即可。此外,概化理论还对“常模参照”决策和“标准参照”决策加以区分,这也是仅以“等级顺序”进行决策的经典测量理论所无法实现的。

本研究采用实验法,编制了英语口语测试的评分标准,并以65名初二学生为样本获得其英语口语测试成绩,应用概化理论对该评分标准及评分者信度等进行分析。研究的目的在于,分析英语口语测试中误差的各种来源,从而为有效控制误差来源,提高英语口语测试的信度提供实证参考,同时也为改进评分标准和测试环境提供量化参考。

二、研究方法

(一)研究步骤

本研究主要有以下几个步骤:

首先,查找文献学英语,依据相关理论编制符合新课程标准要求的英语口语测试评分标准;

其次,根据新课程标准规定的初二学生应该掌握的话题英语口语评分标准表格,设计口语测试试题,并确定口语测试的形式;

再次,寻找样本进行施测;

最后,使用Brennan R L的mGENOVA软件,对数据进行分析处理并撰写报告。

(二)研究工具

托福口语评分对照表_英语标准口语_英语口语评分标准表格

1.口语测试评分标准

英语口语测试评分标准由研究者自行编制,编制依据主要是新课程标准对综合语言运用能力的要求以及Bachmann的语言交际能力模型。评分标准以知识应用、口语技能、表现力为一级指标,其下分设15个二级指标,每个二级指标分设三个等级,目的在于分别考查学生对语言知识的应用能力、英语口语的基本技能以及英语口语应用中的策略能力,最后以三个一级指标合成的总成绩来衡量学生的英语口语综合应用能力。

2.口语测试形式

口语测试的形式有即兴演讲、角色扮演、小组讨论等。在不影响测试结果的同时,研究者还需要考虑操作的简便性。综合考虑后,本研究选择了即兴演讲的形式。整个测试分成三个环节:第一环节为学生自我介绍英语口语评分标准表格,时间约1分钟;第二环节为学生即兴演讲,时间约3分钟;第三环节为问答阶段,即评委根据学生的自我介绍及演讲内容提出相关问题,学生回答,时间为1分钟。由于即兴演讲和问答都是现场抽题,现场回答,学生不能提前准备英语口语评分标准表格,因此,学生能否说得对,说得好,更多与他们平时的积累有关。因此,这种测试方式可以考察学生的口语综合应用能力。

3.测试对象和评委的选择

本研究从山东省济南市几所中学抽取了65名初二学生,女生人数略多于男生。评委有三人,均是有着多年教学经验的中学英语教师。

4.研究设计

根据我们的假设,知识应用、口语技能、表现力三个指标考察的能力是既有相关关系但又有区别的三种能力或特质,符合多元概化理论的应用条件。我们将学生在这三个指标上表现出来的英语口语综合应用能力作为测量目标(p),将对英语口语评估有较大影响的评估者因素(r)作为评估侧面,并假定评估者(r)随机取样于容量无限的评估者全域初中英语口语测试信度的概化理论应用研究,被试(p)也随机取样于容量无限的被试总体英语,这样就形成了多维度的单侧面p·×r·完全随机设计。

三、研究结果

(一)评分标准有较好的信度学英语,评委则是测试中误差的主要来源之一

概化理论的优势在于,它可以根据不同的误差来源对测量分数进行具体分解,并通过方差分析的方法,深入考察误差来源对测量信度的影响程度。通过分析我们发现,本次测试中,研究者自编的评分标准有较好的信度,三名评委的评分误差则较大。

表1为每位评委对每个一级指标给出的平均分,及三位评委对于每个一级指标给出的总平均分。表2为三位评委对所有选手打分的总平均分。我们发现,三个一级指标的总平均分比较接近,而三位评委打分的总平均分差异较大英语口语评分标准表格,评委2的平均分比评委1高出了16分。

猜你喜欢

托福口语评分标准及案例分析

先看一下新托福口语要求的七个方面的标准,具体如下:但此标准并未对考生的口语表达速度作硬性的要求结合上面的要求,我认为口语考试大致从三个方面考察考生。下面我以托福口语task1为例来分析一下具体的答题技巧。...

托福口语评分标准详解

托福口语评分标准详解总结下来,即考生必须尽量做到使自己的语言流畅、清晰、易懂,并且能够熟练使用口语词汇。从新托福口语评分标准来看,答题过程中,清晰是关键。毕竟这是机考,考官听不清,考生没有像雅思那样立即被Pardon的机会。...
书面表达假设你参加了学校举办的初二英语口语演讲大赛,大赛的主题是:介绍我的好朋友Olivia。表格中列出了她的一些具体情况,请根据此表写一篇演讲稿。比班上其他任何学生都努力;富有幽默感;要求:1.表达清楚,语法正确,上下文连贯;3.字数在80字左右,开头已给,不计入总词数。...

托福口语评分表与托福口语评分标准的比较

在托福考试中口语考试最受关注,下面,就让小编为大家介绍一下托福口语评分标准表做个对照吧!一、托福口语评分表对照2.一个考生的六道口语题,至少会被三个不同的考官评分。二、托福口语评分标准三、托福口语app推荐...

口语评分标准,原来考官喜欢这样的阿姨啊!

似乎口语的分数也会萌萌哒。考官大爷们的喜好,我们通常称之为——雅思口语评分标准。评分标准告诉我们,考官大爷们好这四口儿:所以在面对老外考官的口语考试中,请把他们当成小孩子,老老实实给他们讲他们想听的故事。所以,在口语考场上,请做一个有逻辑的话痨。每场口语考试都是考生和考官之间的一场关于“你猜我背没背?...
雅思写作和口语的评分标准全面升级!雅思写作评分标准分析写作的评分标准有四个维度,分别有以下四个:考官会分别对这四个维度进行打分,再取平均值来换算成雅思小作文的分数。评分标准:7分说语法和标点控制很好。评分标准:7分标准里写,语法和标点大体上控制得很好。雅思口语评分标准分析雅思考试口语评分标准雅思考试口语主要评分细则口语的评分标准依然还是四个维度,但写的更详细了:...

雅思评分标准更新了,口语和写作有这些变化

近期雅思全球官网更新了雅思的评分标准,(目前中文官网还未有消息)。新版写作TASK1评分标准新版写作TASK2评分标准本次更新的新版评分标准中,评分标准依旧是4个维度:从流利度和连贯度来说评分要求:新版口语评分标准新版口语评分标准依旧是四个维度:我们能够发现,在新版的口语评分标准中,还是非常重视语速的,因此同学们在平时练习的时候要注意这方面啦!...

雅思口语评分规则解析

但是,在与考官互动的口语考试模式下,发音却最能直接影响到考官对考生的印象和理解。运用不同的复合语法结构是口语评分标准中对语法的明确要求。无论是以上的哪种情况,都会在考试中让考官质疑我们在口语中的语法能力和理解,影响我们在语法上的分数。在这里,可以提示大家的是同义替换一直是雅思考试检测词汇的重要手段,口语也不例外。但是,这对于雅思口语考试的要求,是远远不够的。...

发表评论

评论列表