搜索引擎的基本排序原理搜索引擎的基本排序原理 我们向搜索引擎提交一个查询, 搜索引擎会从先到后列出大量的结果, 排序的不同带来的经济效应也不同, 我们想要的就是让自己的搜索结果靠前, 最好是能得到 NO
那么这些搜索结果排序的标准是什么呢
还是看看百度搜索研发部以求医为例谈搜索引擎排序算法的基础原理
比如, 假如我牙疼, 应该去看怎样的医生呢
假设只有三种选择: A 医生, 既治眼病, 又治胃病; B 医生, 既治牙病, 又治胃病, 还治眼病; C 医生, 专治牙病
A 医生肯定不在考虑之列, B 医生和 C 医生之间, 貌视更应该选择 C 医生,因为他更专注, 更适合我的病情
假如再加一个条件: B 医生经验丰富, 有二十年从医经历, 医术高超, 而 C 医生只有五年从医经验, 这个问题就不那么容易推断了, 是优先选择更加专注的 C 医生, 还是优先选择医术更加高超的 B 医生,的确成了一个需要认真权衡的问题
至少, 我们得到了一个结论, 择医需要考虑两个条件: 医生的专长与病情的适配程度、 医生的医术
大家肯定觉得这个结论理所当然, 而且可以很自然地联想到, 搜索引擎排序不也是这样吗, 既要考虑网页内容与用户搜索查询的匹配程度, 又要考虑网页本身的质量
但是, 怎么把这两种因素结合起来, 得到一个, 而不是两个或多个排序标准呢
简单的加减乘除是不够严谨的, 最好能跟数学这样坚实的学科联系起来
人类在古代就能建造出高楼, 但要建造出高达数百米的摩天大厦, 假如没有建筑力学、 材料力学这样坚实的学科作为后盾, 则是非常非常困难的
同理, 搜索引擎算法要处理上亿的网页, 也需要更为牢固的理论基础
求医, 病人会优先选择诊断准确、 治疗效果好的医生
而对于搜索引擎来说,一般按网页满足用户需求的概率从大到小排序
假如用 q 表示用户给出了一个特