英语口语试题与答案自动评分.pdf
英语口语测试问答题型的自动评分王丽潘复平董滨颜永红中国科学院声学研究所语言声学与内容理解重点实验室摘要:本论文是关于英语口语测试中问答题型的自动评测的研究。英语口语评测的问答题型会给出一定的提示,即关键词。3打分特征的提取打分特征应该精确地表示考生的答案,也就是全面的描述了答案的各个方面包——274——音频声学含:语音的流利度、发音质量、内容相关性和语法的正确性,这样才能给出一个合理的分数。...
英语口语试题及答案自动打分 王立攀富平 董斌彦永红 中国科学院声学研究所语音声学与内容理解重点实验室 摘要:本文是关于英语口语考试中问答题的自动评价研究。该系统包括三个主要部分:语音识别、评分特征提取和评分映射。大多数打分特征的提取都是基于语音识别的识别结果英语,因此识别的好坏直接影响机器打分的性能。评分特征应该能够准确描述对应的语音英语口语测试软件打分,因此需要涵盖考生回答的方方面面,包括:语音流畅度、发音质量、内容相关性和语法正确性。最终的评分特征通过SVM模型映射到考生的分数。人工打分是衡量机器打分的参考依据,我们可以通过计算人工打分与机器打分的相关系数来评价评价系统的性能。,%的提升英语口语测试软件打分,这也证明了我们系统的可用性和有效性。关键词:语音识别;评分功能;相关系数 中国科学院声学研究所第四届青年学术会议论文集 通过分析人工评分与自动评分的相关系数和人工评分的相关系数来衡量自动评价系统的性能,因为人工评分是自动评分系统最直接的参考。本文的组织结构如下:首先,我们讨论了我们系统中使用的语音识别相关技术。接下来详细介绍评分特征的提取。第四部分介绍了相关实验和结果。2 Speech Recognition Fig. 2 Speech Recognition Fig. 2 我们的评估系统中使用的识别结构如图所示英语口语试题与答案自动评分.pdf,包括三个主要模块:LVCSR、KWS和CGSR。
通过LVCSR,我们可以得到BU BEST的识别结果和词图。我们的科目是高中 英语口语 考生,所以我们的发音词典是根据高中 英语 词汇构建的。同时学英语,我们收集英语教科书和在线高中英语语料库以及专家构建的正确语法和人工参考答案来训练相应的语言模型。声学模型是从同一地区的高中考生的数据中训练出来的,它是一个基于上下文的、cross-word、triphone 模型。考生的声音通过前端处理得到声学特征。然后以声学特征为输入,利用语言模型和声学模型对维特比在词典中形成的搜索空间进行解码,产生优选的最佳识别结果和词图。词图可以转化为混淆网络学英语,是每个时间点所有可能的候选词的线性展示。英语口语 评价的问答类型会给出一定的提示,即关键词。关键词识别就是把在网络上搜索中出现的关键词进行混淆,也就是关键词覆盖。CGSR 使用受限语法来计算音素的置信度。根据题目、场景和提示英语口语测试软件打分,我们构建了大量的参考答案,几乎涵盖了所有考生的答案。我们可以通过强制对齐参考答案网络和候选人的语音来获得最佳的限制语法识别结果。根据不同的文法,音素置信度计算包括三种类型:限制文法、自由文法和关键词文法。受限文法是根据ABNF 格式由参考答案中的有效词组成的。
为了获取考生的停顿信息,吸纳发音不佳的部分,在限制语法的基础上插入一段停顿,将一系列填充音素并联起来,形成自由语法。关键字语法是通过关键字和填充音素形成评估的已识别关键字的发音质量。3 评分特征的提取 评分特征应该准确地代表考生的答案英语口语测试软件打分,即综合描述答案的各个方面包括 — 274 — Audio Acoustics including: fluency of speech, pronunciation quality, content relevance and grammatical correctness, so that a reasonable score可以给。. KCR表示关键词的覆盖率,可以通过公式1计算: KCR:四逆猫 (1) Nh和Nm。
猜你喜欢
发表评论
评论列表