电脑桌面
添加小米粒文库到电脑桌面
安装后可以在桌面快捷访问

搜索引擎的基本排序原理

搜索引擎的基本排序原理_第1页
1/2
搜索引擎的基本排序原理_第2页
2/2
搜索引擎的基本排序原理搜索引擎的基本排序原理 我们向搜索引擎提交一个查询, 搜索引擎会从先到后列出大量的结果, 排序的不同带来的经济效应也不同, 我们想要的就是让自己的搜索结果靠前, 最好是能得到 NO.1 。 那么这些搜索结果排序的标准是什么呢? 还是看看百度搜索研发部以求医为例谈搜索引擎排序算法的基础原理。 比如, 假如我牙疼, 应该去看怎样的医生呢? 假设只有三种选择: A 医生, 既治眼病, 又治胃病; B 医生, 既治牙病, 又治胃病, 还治眼病; C 医生, 专治牙病。 A 医生肯定不在考虑之列, B 医生和 C 医生之间, 貌视更应该选择 C 医生,因为他更专注, 更适合我的病情。 假如再加一个条件: B 医生经验丰富, 有二十年从医经历, 医术高超, 而 C 医生只有五年从医经验, 这个问题就不那么容易推断了, 是优先选择更加专注的 C 医生, 还是优先选择医术更加高超的 B 医生,的确成了一个需要认真权衡的问题。 至少, 我们得到了一个结论, 择医需要考虑两个条件: 医生的专长与病情的适配程度、 医生的医术。 大家肯定觉得这个结论理所当然, 而且可以很自然地联想到, 搜索引擎排序不也是这样吗, 既要考虑网页内容与用户搜索查询的匹配程度, 又要考虑网页本身的质量。 但是, 怎么把这两种因素结合起来, 得到一个, 而不是两个或多个排序标准呢? 简单的加减乘除是不够严谨的, 最好能跟数学这样坚实的学科联系起来。 人类在古代就能建造出高楼, 但要建造出高达数百米的摩天大厦, 假如没有建筑力学、 材料力学这样坚实的学科作为后盾, 则是非常非常困难的。 同理, 搜索引擎算法要处理上亿的网页, 也需要更为牢固的理论基础。 求医, 病人会优先选择诊断准确、 治疗效果好的医生。 而对于搜索引擎来说,一般按网页满足用户需求的概率从大到小排序。 假如用 q 表示用户给出了一个特定的搜索查询, 用 d 表示一个特定的网页满足了用户的需求, 那么排序的依据可 以用一个条件概率来表示: 这个简单的条件概率, 将搜索引擎排序算法与概率论这门坚实的学科联系了起来。 可以看到, 搜索引擎的排序标准, 是由三个部分组成的: 搜索查询本身的属性 P(q)、 网页本身的属性 P(d)、 两者的匹配关系 P(q| d)。 对于同一次查询来说, 所有网页对应的 P(q)都是一样的, 因此排序时可以不考虑, 即搜索引擎为了提...

1、当您付费下载文档后,您只拥有了使用权限,并不意味着购买了版权,文档只能用于自身使用,不得用于其他商业用途(如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利)。
2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。
3、如文档内容存在违规,或者侵犯商业秘密、侵犯著作权等,请点击“违规举报”。

碎片内容

搜索引擎的基本排序原理

确认删除?
VIP
微信客服
  • 扫码咨询
会员Q群
  • 会员专属群点击这里加入QQ群
客服邮箱
回到顶部