一种基于语义相似的中文文档抄袭检测方法

胡布焕; 张晶; 张凌

首页> 中文期刊> 《深圳大学学报：理工版》 >一种基于语义相似的中文文档抄袭检测方法

一种基于语义相似的中文文档抄袭检测方法

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

为解决在文本抄袭行为中由于避开检测而对文本内容进行的一些同义词替换、文本释义等操作问题,提出了一种基于语义相似计算的中文文档抄袭检测方法,将文档以句子为单位切分,利用word2vec模型将句子中的词语表示为词向量的形式,作为卷积神经网络(convolutional neural net-work,CNN)的输入,使用卷积神经网络提取和筛选句子的特征,计算句子对之间的差异,输出句子对的相似度,相似度高的句子对视为抄袭.利用大型可公开的腾讯云文本相似数据集检测试学生作业的抄袭情况,结果表明,传统的移动窗口指纹特征提取法虽然能够较为准确地找出两个文档中相同的片段,但是对于语义相似的文本容易受到噪声影响,提出的基于语义相似计算方法能够发现文档中语义相似的部分.

著录项

来源
《深圳大学学报：理工版》 |2020年第s01期|107-111|共5页
作者
胡布焕; 张晶; 张凌;
展开▼
作者单位

广东省计算机网络重点实验室;

华南理工大学计算机科学与工程学院;

广东广州510641;

展开▼
原文格式 PDF
正文语种 chi
中图分类文字信息处理;
关键词
计算机科学; 自然语言处理; 抄袭检测; 语义相似度; 词向量表示;

相似文献

中文文献
外文文献
专利

1. 基于语义匹配的抄袭检测方法 [J] . 邹杜 ,陈育青 ,张凌 . 华南理工大学学报（自然科学版） . 2013,第007期
2. 一种基于语义相似度的信息资源语义聚类算法 [J] . 熊芳 ,黄宏斌 ,黄玉成 . 计算机工程与科学 . 2012,第011期
3. 基于多语义相似性的关系检测方法 [J] . 谢金峰 ,王羽 ,葛唯益 . 西北工业大学学报 . 2021,第006期
4. 基于语义相似度的话题关联检测方法 [J] . 翟东海 ,崔静静 ,聂洪玉 . 西南交通大学学报 . 2015,第003期
5. 一种改进的中文文档图像倾斜检测方法 [J] . 孙楠 ,刘志文 . 计算机仿真 . 2006,第009期
6. 相似、模仿还是抄袭?——透视广告创意的抄袭之风 [C] . 吴柏林 . 2005年全国广告学术研讨会 . 2005
7. 一种基于语义网络的中文文本相似度计算方法 [A] . 邹能清 . 2015

一种基于语义相似的中文文档抄袭检测方法

摘要

著录项

相似文献

相关主题

期刊订阅