英语作文自动评分方法研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

在英语学习中，主观题是衡量一个学生掌握语言能力的有效方法，目前已被广泛的应用于各类英语考试中。随着现代科技的发展，计算机正在不断的向智能化的方向前进。自动作文评分方法的研究和开发也是这一趋势的具体体现。
　　自动作文评分就是利用计算机技术对作文进行识别，分析和打分，相比人工审阅，计算机识别不仅成本更低，而且更加客观，在保证公平性的前提下，极大的提高审阅效率。除此之外，自动作文批改还可以统计出每篇作文的用词构成，单词拼写，语法错误等，从而提供给教师和学生更科学的指导意见。
　　本文从作文语言和内容两个方面讨论了如何对作文进行属性抽取，并提出了一个改进的分类预测算法。
　　对于作文的内容方面的表示，本文采用潜在语义分析(Latent Semantic Analyze，LSA)方法。相比较分析一个句子中单词的出现情况，它更关注上下文范围内的语义构成。这样的分析方法更加符合人类的阅读和理解方式。其核心思想是通过奇异值分解将文档向量和词向量投影到一个低维空间，使得相互之间有关联的作文即使没有使用相同的词也能获得近似的向量表示，从而得出作文上下文的关联度。同时利用卡方检验等统计的方法计算出更能代表作文内容的特征单词，提取出这些单词作为表征作文内容的特征项。通过实验结果得出:抽取特征单词的LSA方法比未抽取特征单词的LSA在准确性上具有少量的优势。
　　在作文的语言方面，本文从词汇、语法、句法结构三个角度分别抽取若干特征来度量作文的语言质量，并结合自然语言处理技术得到一个更加合理的评分结果。对于句法结构的多样性可以通过句法分析器Stanford Parser来获得，Stanford Parser在提取句子的句法树的同时，也会标识出句子中单词或短语的成分，如主语，谓语，从句等，通过句法树可以得到句子中不同种类从句个数、不同词性单词个数等特征值;对于作文中可能出现的语法错误，通过定义描述常用英语语法错误的XML规则文件，将经过Stanford Parser处理后带标识的英语作文与错误语法规则进行匹配来检查语法错误，得到代表作文语法错误情况的特征值。这些特征值和表示作文内容方面的特征值一起，构成了能够表示英语作文的特征向量。
　　针对近邻算法(k-NearestNeighbor，KNN)算法存在的一些不足之处，本文在其基础上做出了一些改进:一方面利用信息增益方法计算出作文各特征项的权值，对各特征项进行加权;另一方面对样本点与测试点的距离进行加权，即越近的样本点给予越高的权值。通过这一特征向量，可以利用k近邻算法对作文进行评分。并结合上面提到的多种作文内容表示方法，进行了实验对比。实验表明，以信息增益为权重的距离加权KNN算法结合带特征选取的LSA与教师评分具有最小的误差，与未改进的KNN算法结合LSA相比，与教师评分的误差从4.51降到了2.85，表现出了最好的效果。

著录项

作者
倪诗梦;
展开▼
作者单位

东南大学;

展开▼
授予单位东南大学;
学科计算机科学与技术；计算机应用技术
授予学位硕士
导师姓名姜浩;
年度 2015
页码
总页数
原文格式 PDF
正文语种中文
中图分类计算机化教学;语文教学;
关键词
英语考试; 作文题; 自动评分方法; 潜在语义分析; k近邻算法;

相似文献

中文文献
外文文献
专利

1. 英语作文自动评分系统的信度和效度研究——基于不同类型写作任务文本量化特征分析 [J] . 张国强 ,何芳 . 外语测试与教学 . 2022,第1期
2. 批改网英语作文自动评分系统评分质量研究 [J] . 高健民 . 哈尔滨学院学报 . 2021,第007期
3. 基于词向量聚类及随机森林的英语作文自动评分研究 [J] . 赵瑞雪 . 微型电脑应用 . 2020,第006期
4. 英语作文自动评分系统研究与实现 [J] . 张锐捷 ,宋万里 ,刘琪 . 现代信息科技 . 2019,第004期
5. 英语作文自动评分系统研究与实现 [J] . 张锐捷1 ,宋万里1 ,刘琪1 . 现代信息科技 . 2019,第004期
6. 大学英语作文自动评分中分级词表的有效性研究 [C] . . 第四届全国学生计算语言学研讨会(SWCL-2008) . 2008
7. 基于机器学习的英语作文自动评分算法的研究与设计 [A] . 郭柯宇 . 2021

英语作文自动评分方法研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅