大规模在线英语口语测试实践与反思
文章基于畅言互动英语口语测试平台开展了大学英语口语测试实践,探讨大规模在线口语测试的可行性,并就具体实施中存在的问题提出解决思路。大规模在线口语测试设计和实践对在线口语测试平台的反思...
【摘要】计算机辅助口语测试技术为实现大规模口语测试提供了可能。本文基于长岩交互式英语口语测试平台,开展高校英语口语测试实践,探讨大规模在线口语测试的可行性,针对具体实施中存在的问题提出解决方案。结果表明,长岩互动英语口语测试系统具有较好的可操作性,其技术设计能够达到预设目的,但在测试有效性、测试可靠性和技术集成度方面有待进一步提高。
【关键词】口语测试:计算机辅助;大学英语:反思
中图分类号:G420 证件识别码:A 纸质编号:1009—8097(2013)06—0076—05
介绍
随着高校英语教学改革的深入推进和大力推进,口语教学和考试得到了国内高校的广泛重视。然而,在传统的教师主导的口语测试环境中,由于学生人数多、考试时间长、教师精力有限,难以实现大规模英语口语测试。现代信息技术,以计算机技术为主,为推动高校英语教学改革提供了强有力的技术支撑,也为实现大规模英语口语考试提供了手段。1. 大学英语口语考试的现状
口语考试是高校英语教学评价的重要手段。自2006年全面实施高校英语教学改革以来,全国高校在英语教学理念和教学模式上都有不同程度的实施,但口语教学及其考试未能在与时俱进方面取得突破。廖一斌通过短信调查发现,大部分高校(很多是211所高校)没有口语考试到位,期末考试没有部分口语考试。笔者从参加外教学会暑期教学研讨会的其他高校老师那里了解到,很多实行口语考试的高校都陷入了两难境地。一方面,为了督导学生的口语学习,提高学生的口语能力,必须口语考试;另一方面英语口语在线评分,由于采用传统的教师主导的口语考试英语口语在线评分,为了保证考试的真实性和公平性,通常允许学生以小组讨论的形式就某个话题进行交流,并安排至少两名老师进行评分,但这种传统的口语考试用于大型高校英语口语考试, 这不仅需要大量的时间和精力,而且对学生口语能力的提高效果有限。
这
造成上述现象的主要原因有:(1)扩容后的师生比例严重,无论是1:1、1:2还是1:3的师生比例考试相结合,都需要大量的时间和精力,口语而且考试实施难度大。(2)没有规范化培训,教师考口语能力与水平参差不齐,无法保证口语考试的信效度,为了保证公平性,每个考队要求教师超过两名,也会使得大规模口语考试难以实现。(3)缺乏相关部门的干预和指导,口语考试没有正式纳入学生评价体系或占比很小,也没有纳入教师的工作量,费时费力,教与教的成效不明显。由此可见,传统的口语考试已经不能满足当前高校英语教学的需求,大规模英语口语考试亟需一种省时、省力、高效的考试方法。随着计算机和网络技术的发展,计算机辅助口语测试技术日趋成熟,“多媒体软件在口语教学中的应用是对传统口语教学的突破,也是大力加强口语教学的社会现实”。
二、长岩互动口语测试平台介绍
英语学习平台是由科大讯飞信息技术有限公司开发的独立学习系统,可部署在内网、外网和计算机教室。系统集成了智能语音技术,可帮助实现智能化、自动化的英语口语测试、英语听力测试、英语口语会话学习、英语阅读训练和英语字速记,有利于教师快速、轻松地掌握学生的英语水平和学习进度。口语测试功能提供了一个开放的测试环境,教师可以设置测试问题,并通过系统的实时评估功能,可以自动进行测试、评分并生成测试报告。其关键语音技术包括:(1)语音合成技术(TextTo Speech,TTS),可实时自动将任何文本转换为连续的自然语音,提供高效便捷的语音信息服务;(2)语音识别技术(Auto SpeechRecognize,ASR)允许计算机区分人类语音并提取语音中包含的文本信息,以实现有效的人机交互。(3)语音评价技术,即计算机自动评分,检测错误并给予纠正指导。上述关键的语音技术服务是通过 Web 服务实现的。
3. 大规模在线口语测试的设计与实践
1 实践对象
研究对象是我校2012届普通班学生。目前英语,我校高校英语教学实行分级教学,分为长旺实验班(三级起步班)、实验班(二级起步班)和普通班(一级起步班)。其中,普通班有2569名学生,占总成绩的76%,其整体学期评价结果由普通成绩(10%)、口语成绩(10%)、期中成绩(20%)和期末成绩(60%)四部分组成,其中口语成绩是指学期末的在线口语考试成绩。
2 实施计划
口语考试将在我校多维语言培训中心的两个校英语自主学习教室举行,共计200名学生座位。
(1) 时机
期末口语考试为期两天,考试时间为8:00-12:00和13:00-17:00,学生按预先安排的时间段进入自习中心,每一轮考试过程(包括组织过程)控制在30分钟内。口语考试时间为10分钟,学生不得因非设备等客观原因重考。教师无需在场,有一名实验室技术员和两名学生助理负责维护考场秩序并解释考试说明。
(2)题型设计
本次口语测试内容由教师根据课文主题设计,共九套不同主题的口语试题(题型设计见表1),随机抽取学生进行口语测试。
3 学生终端
学员登录英语Speak Interactively学习平台,输入学号和密码,确认个人信息,进入口语考试界面。界面为学生提供九套口语试题,学生随机选择一套后,考试口语正式开始。
第一部分是短文阅读。朗读片段的内容和体裁选自新的综合性大学英语课程的文本。宣读说明后,系统提供示范朗读(图2),为学生提供阅读技巧的参考和准备时间。学生可以选择跳过,直接进入大声朗读测试,该测试将录制 2 分钟。
在第二部分,主题以新视界视听口语的主题设计为基础,并提供了思想大纲(图3),并要求学生用口语来组织和表达大纲。这部分的准备时间为 3 分钟,录制时间为 2 分钟。
学生只需 10 分钟即可在计算机终端上完成整个口语考试。总体而言,该平台提供的学生侧口语测试不错。根据口语考后学员的面试记录,学员们普遍认为:(1)平台提供的界面友好、操作简单、省时高效。(2)大部分学生对自己的口语成绩感到满意,认为网上口语考试客观公正。
4 教师终端
口语测试结束后,教师可以在任意电脑终端登录学习平台管理系统(图4),查看学生的考试成绩和考核报告,导出学生的考试成绩和考试记录。如果您不确定学生的成绩,可以查看详细的口语测试报告(图 5)。报告将提供学生口语考试每个部分的录音和原始文本参考,教师可以播放学生的录音进行重新评估,以确保其正确无误。
根据教师的考试总结和会议记录,长盐互动在线口语测试平台具有以下优势:(1)简化考试组织和管理,节省人力物力。考试口语,教师无需在场,整个考试过程由系统口语成绩和评价报告自动生成,教师需要完成对学生成绩的整体管理,掌握学生口语水平。(2)系统自动生成的评价报告,可以更真实地反映学生口语现状,为教师口语教学提供参考,缓解师生在口语教学中一对一交流机会少的局面,增进教师对学生的了解。(3)系统的录音保存功能和导出功能,打造了丰富的口语语料库,既可以通过录音回放跟踪学生的口语学习进度,还可以为教师进行口语教学研究提供数据资源。(4)为学生提供个人原创录音和演示音频,还原口语测试场景,有助于学生自我分析,发现口语表达中的问题。
4. 问题与思考
1 关于在线口语测试平台的思考
(1)测试有效性
效度是测试的可解释性和可推广性。大学英语口语考试是对大学学生基础阶段英语口语能力的评估。《大学英语课程教学要求》对基础阶段口语能力提出了要求,即“能够提问、复述和讨论教材和一般听力材料的内容;能够使用英语进行一般的日常对话;能够就社会生活的一般话题进行简单的对话、讨论和演讲,清楚地表达想法,并以基本正确的语言和语调说话”。长彦互动口语测试平台拥有的语音识别技术(ASR)实现了考试机制口语数字化模拟,减轻了考官的压力和口语测试的有效性,通过朗读、带图说话、 并重复。这种人机对话具有相对固定的参考答案,具有命题容易、评分相对客观可靠的优点,但平台支持的人机对话测试模式仅限于部分试题类型,无法实现基于计算机的试题类型测试口语对话等交际方式。 讨论、辩论等,因此很难实现真正的沟通,体现沟通的真实性和互动性,不能完整准确地反映学生的真实沟通能力。蔡继刚认为,“只有当试卷的内容能够测试多种相关的交际功能,并且这些功能具有足够的代表性时,才能具有较高的效度”。理想情况下,口语测试应采用对话、讨论、辩论和其他具有交流性和互动性的问题的形式。但是,这类题型所要求的真实性和互动性,目前还难以解决,未来的研发应围绕这一方面,使在线口语测试更加现实,进一步提高在线口语测试的效度。
(2)测试可靠性
可靠性主要是指测试的稳定性和可重复性。大规模口语测试,要实现对学生实际口语能力的准确、公正的衡量,需要考虑评分模型的可行性和可靠性。中国大学英语口语考试的对象是水平比较低的学生,所以具体的评分标准要根据学生的实际情况来决定。综合和逐项是目前大型考试常用的评分模式。为保证口语测试的可靠性,提高口语测试对学生口语学习的抵消作用英语口语在线评分,评分标准和原则应保持一致,为学生和教师提供多角度、多层次的评估和分析,为今后的学与教提供参考。蔡继刚指出英语培训,可以使用计算机对口语评分的内容进行分解,评分将专业化、精简化,从而达到计算机口试的准确性和高效率。在线口语测试系统的评分一致性需要通过专业、详细的评分系统来实现。这样的评分系统可以提供:1)能力分析评分,从发音、词汇量、流利度等各个方面对学生的口语表达能力进行评分,然后根据各方面的分数计算总分; 2)项目分析评分,对考生每道题的内容表达和语言表现进行评分;3)整体评分,将学生的口语能力分为五个级别,并根据每个级别规定的标准进行评分。长岩互动英语学习系统提供的口语测试平台,没有细化评分标准,系统自动生成口语绩效考核报告,比较简单,只是列出了单项成绩,并没有明确说明口语成绩的得分点或扣分,尤其是学生口语成绩的能力分项没有单独评分。以这种方式形成的评估报告只能为学生和老师提供整体判断,并不能帮助学生了解自己口语学习的优势和问题,并跟进自己的学习。
(3)检测技术
交互式英语学习平台的服务器端采用VS2008开发工具C#语言开发,以.NET Framework 2.0为实现环境,产品为B/S架构,采用AJAX技术,进一步提高系统页面的表现力。服务器的配置要求为:Intel Penfium 3.2 GHz(2核)CPU,2G内存,200G以上可用磁盘空间和100M网卡,服务器对应的并发性能支持1000人同时在线和50项关键服务,口语测试中每个问题的评估时间不超过评估引擎客户端所需时间的120%。客户端使用 Delphj 开发 shell 和一些允许离线使用的客户端函数,其他部分则通过嵌入浏览器控件打开服务器页面来实现,使客户端有更好的响应效果。系统采用的关键语音技术服务通过Web服务实现,方便灵活部署。
但是,作为口语考试系统的重要功能之一,该系统的数据库管理和维护功能略显薄弱,难以提供学生考试记录并传输给客户。为了保证传输的可靠性和可行性,方便在检查过程中大量文件的传输,未来在线口语测试系统的研发不仅需要高性能的网卡来提高服务器的网络并发能力,还要有效地划分系统服务器,建立应用服务器和数据库服务器大规模在线英语口语测试实践与反思,使用Microsoft SQL Server 2008等大型关系型数据库作为后台管理数据库,扩展数据管理的有效性,建立“以综合数据处理、流程总结、试题数据库管理和信息检索技术为核心的大规模网络数据集成应用平台。
2 关于在线口语测试协议和实现的思考
(1)优化测试计划
这个口语测试
只有短读和题目口语两类题目英语培训,操作容易实施,在机考口语测试中也容易实现,但考试形式有点单薄。人类语言具有高度的交际际和互动是学习语言的最大目的。短文阅读侧重于语音基础和群体停顿,而主题演讲侧重于描述事物或叙述事件的能力,这两种形式的考试都缺乏交际功能,只能局限于描述、叙述等语言功能,无法测试较高的语言能力,存在引出的语篇功能和语篇范围比直接口语测试更窄的问题。
此外,本次口语考试的考试时长为10分钟,不包括考试指导和准备的时间,实际口语表达的时间仅为4分钟,其中只有2分钟用于主题口语。后期的学生面试结果也证实了这一点,有学生表示“考试才刚刚开始,我还没有找到结束的感觉”。测试的长度需要考虑许多客观因素,例如学生人数、设备数量、教学计划和实验者的工作时间。合理有效的考试时长,不仅可以高效有序地完成大规模的口语考试,还可以为学生提供足够的时间来展示自己的口语能力。可以看出,口语考试的时间以后需要调整,调整可以根据大学英语4级、6级口语考试等大型考试的时间设定标准。
(二)完善评价体系
目前,口语
我校学生分数占最终综合评价分数的10%,老师对学生口语表现的评价主要靠最终的网口语考试成绩,这使得学生参加网口语培训的参与度不高,大部分学生反映很少在自学中心练习网口语,有的同学甚至从未去过自学中心。只有通过建立多层次、多维度的评价体系和口语学习激励机制,加大口试在学期成绩中的权重,将网考口语纳入形成性考试,从平时、期中、期末考核三个方面对学生提出要求口语,注重平时成绩的积累,提升学生参与线上口语培训的积极性,建立学生对口语学习的主观意识英语口语在线评分,从而减少偶然因素的影响,使评价更加客观。
(三)推动教师多维度角色转变
教师的指导、监督和管理角色在口语测试中起着重要作用。教师作为网口语考试的管理者,应及时查看学生的口语练习记录,对学生的在线练习数据给予反馈和帮助,引导学生参与更多口语练习任务,实现在线口语练习的良性循环,保证教与学的双向互动。这种做法凸显了教师管理的缺失,大多数教师表示,他们还没有从传统的口语测试角色转变,在线口语培训只停留在学生的口头要求上,大多数教师对在线测试平台没有深入的了解,更不用说监督和指导学生了。因此,为了让教师熟悉在线口语考试系统,对教师的系统培训尤为迫切,此外,还需要建立相应的机制来规范教师的行为,避免教师因在线口语考试系统的自评功能而完全依赖计算机评价的被动现象。
5. 结束语
口语测试是语言能力测试中不可或缺的一部分。现代教育技术的发展为高校在英语口语测试方面寻求新的突破提供了契机,而计算机辅助的大规模英语口语测试仍处于实验阶段,如何使大规模口语测试易于操作并具有显著的有效性和可靠性,仍需大量的实践和探索。
猜你喜欢
发表评论
评论列表