电脑桌面
添加小米粒文库到电脑桌面
安装后可以在桌面快捷访问

基于WEB的论文相近度的比较系统

基于WEB的论文相近度的比较系统_第1页
1/41
基于WEB的论文相近度的比较系统_第2页
2/41
基于WEB的论文相近度的比较系统_第3页
3/41
基于 WEB 的论文相近度的比较系统 论文关键词:相似度 分类 特征选择 段落词频 论文摘要: 本课题主要针对毕业设计文档中存在的雷同现象进行了相似度判别算法的讨论。分析了当前论文检测与识别系统的不足之处,并给出一种比较有用的基于分类思想的论文抄袭判定系统的设计思路。系统先对待查论文进行分类,然后通过与同类论文全文相似度计算初步筛选出相似论文集,接着待查论文与每篇相似论文再进行基于段落词频统计的精确比较,最后输出结论。 通过对一定资料的讨论分析可以预测出,该系统对较短的文档能够完成大多数情况的相似度判定,可以在一定程度上满足文档的进行相似度判别的要求。但在日后该系统的具体设计中的还有一些不明确的问题,例如在核心算法上还需要深化讨论才能做好下一阶段的系统具体设计。 1 引言 1 系统的讨论现状 电子学术资源猎取的便利性为学术论文的抄袭、非法扩散等不道德行为提供了方便,必须进行学术论文非法复制的防止和检测。论文相似度识别如仅靠人工来做,工作量巨大,效果也无法保证。近年来,我国学术论文的抄袭与剽窃事件频发,学风问题已成为全社会关注的焦点。《现代汉语词典》对抄袭的定义是: “把别人的作品或语句抄来当作自己的”。在学术着作中,“抄袭是指将他人作品或者作品的片段窃为己有。”准确地说,抄袭是指将他人作品或者作品的片段窃为己有并公开发表‘“。对于论文抄袭的界定笔者认为主要分为两种情况:一是论点抄袭,即抄袭他人的论点,自己另行论证,虽然内容不同,但仍应判定为抄袭;二是内容袭,即只要抄袭论文中有一定比例或具体字数的文字与被抄袭论文相同,就认定抄袭成立。19 年文化部发布《图书、期刊版权保护实施条例实施细则》第 15 条规定:“引用非诗词类作品不得超过两千五百字或被引用作品的十分之一,假如多次引用同一部长篇非诗词类作品,总字数不得超一万字”;“凡引用一人或多人的作品,所引用的总量不得超过本人创作作品总量的十分之一,但专题评论文章和古体诗词除外”。 相关工作 学术论文抄袭的形式和手段多种多样,包括直接将他人论文全盘复制,只改动题目和署名;东拼西凑,抄袭多篇论文的部分段落和语句;抄袭论文的图、表与公式等。这里只讨论文字部分的抄袭判定。论文复制检测是针对学术论文的文本复制检测,其核心任务是推断论文文本之间的相似度。文本复制检测技术产生于 20 世纪末,已有很多典型的系统。根据其采纳的算法,可分为 2 ...

1、当您付费下载文档后,您只拥有了使用权限,并不意味着购买了版权,文档只能用于自身使用,不得用于其他商业用途(如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利)。
2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。
3、如文档内容存在违规,或者侵犯商业秘密、侵犯著作权等,请点击“违规举报”。

碎片内容

基于WEB的论文相近度的比较系统

确认删除?
VIP
微信客服
  • 扫码咨询
会员Q群
  • 会员专属群点击这里加入QQ群
客服邮箱
回到顶部