毕 业 设 计(论 文)题 目:基于 VSM 模型的文本相似性的比较 姓 名 X X X X X 学 号 A A A A A 所在学院 B B B B B 专业班级 C C C C C 指导老师 D D D D D 日 期 摘 要在互联网迅速进展的时代,网络上的信息数量越来越多,种类也比较纷杂。虽然能在我们查询相关信息是提供大量选择,但是靠人工浏览的方式在浩瀚的信息库中找到自己最需要最相关的信息,无疑给用户带来了麻烦,而且效率也十分低下。为了解决这一个问题,关于推断文本相似度的技术应运而生,目前广泛运用于计算机,电信等行业。本文着重阐述了计算文本相似度的过程中会遇到的难题,以及解决这些难题需要用到的相应算法,最后利用 VSM 模型进行简单的设计与运用,完成基于 web 的相似网页检测程序GDVFkqv。70gEoN7。关键字:文本相似度;相似网页检测;VSM 模型ABSTRACTWith the Internet developing rapidly,there are more and more Information on the Internet,and the varieties of Information is becoming more complex.Although we have a bigger chance to use the Information,it is very difficult and inefficient for users to find the Information which they are most needed in the Information Database.To solve this problem,the relevant technology is invented and now widely used in Computer and Telecom field.This passage is mainly demonstrated the problems we may meet when we calculate the text similarity and the relevant algorithm solving the problems above .In the end,we use VSM model to design and complete the Project-Similar Web detection Based On WebHetpt6P。ejmZ6Pp。Key Words:text similarity;similar web detection;VSM modelj4L4n9t。S9Y0LLD。目 录摘 要- 1 -lFpGHt6。cTMHV1j。ABSTRACT - 2 -k4yQoGe。Vxl8WLW。目 录- 3 -L918Wur。XgY3wCv。第一章 绪论- 6 -kotBpSf。EDf2koM。1.1 选题背景 - 6 -qxBNO9M。gX0ndI5。1.2 讨论意义 - 6 -nvNokvY。TznCZ5R。1.3 国内外讨论现状 - 6 -XQIofQG。9UXsIBM。1.3.1 国外文本相似度讨论状况- 6 -gs79kw5。i2OGAZh。1.3.2 国内文本相似度讨论情况- 7 -BKnDyb6。CYpw34l。...