SEO入门必知:搜索引擎的3种核心算法

阅读  ·  发布日期 2022-04-02 08:46  ·  admin

    做网络营销做SEO的朋友都清楚搜索引擎抓去收录都一个算法,就好比我们做一款产品时要添加设备码是一样的,有一定的规则在里面。对于搜索引擎算法,它直接决定你在搜索引擎的排名和搜索自然流量的多少,了解搜索引擎算法也成了每一位网站优化的朋友必修一门课。

    外链是搜索引擎算法中,判断网站权重高低的重要指标,当用户在搜索框中输入关键时,搜索引擎面对大量拥有相同内容的网页,首先需要解决的就是,通过哪些参数觉得网页排名的高低。今天,笔者就简单介绍外链建设中,比较有名的核心算法:PageRank算法、Hilltop算法、Direct Hit 算法。

算法一、PageRank算法

    1998年,Sergey Brin和Lawrence Page提出了PageRank算法。该算法基于“从许多优质的网页链接过来的网页,必定还是优质网页”的回归关系,来判定网页的重要性。该算法认为从网页A导向网页B的链接可以看作是页面A对页面B的支持投票,根据这个投票数来判断页面的重要性。当然,不仅仅只看投票数,还要对投票的页面进行重要性分析,越是重要的页面所投票的评价也就越高。根据这样的分析,得到了高评价的重要页面会被给予较高的PageRank值,在检索结果内的名次也会提高。PageRank是基于对“使用复杂的算法而得到的链接构造” 的分析,从而得出的各网页本身的特性。

    分析:PageRank算法的优点在于它对互联网上的网页给出了一个全局的重要性排序,并且算法的计算过程是可以离线完成的,这样有利于迅速响应用户的请求。不过,其缺点在于主题无关性,没有区分页面内的导航链接、广告链接和功能链接等,容易对广告页面有过高评价;另外,PageRank算法的另一弊端是,旧的页面等级会比新页面高,因为新页面,即使是非常好的页面,也不会有很多链接,除非他是一个站点的子站点。这就是PageRank需要多项算法结合的原因。

算法二、Hilltop算法

    HillTop,是一项搜索引擎结果排序的专利,是Google的一个工程师Bharat在2001年获得的专利。HillTop算法的指导思想和PageRank是一致的,即都通过反向链接的数量和质量来确定搜索结果的排序权重。但HillTop认为只计算来自具有相同主题的相关文档链接对于搜索者的价值会更大,即主题相关网页之间的链接对于权重计算的贡献比主题不相关的链接价值要更高。在1999-2000年,当这个算法被Bharat与其他Google开发人员开发出来的时候,他们称这种对主题有影响的文档为“专家”文档,而只有从这些专家文档页面到目标文档的链接决定了被链接网页“权重得分”的主要部分。

    Hilltop算法的过程:首先计算查询主题最相关的“专家”资源列表;其次在选中的“专家”集中识别相关的链接,并追踪它们以识别相关的网页目标;然后将目标根据非关联的指向它们的“专家”数量和相关性排序。由此,目标网页的得分反映了关于查询主题的最中立的专家的集体观点。如果这样的专家池不存在,Hilltop不会给出结果。

    从Hilltop算法过程可见,该算法包括两个主要的方面:寻找专家;目标排序。通过对搜索引擎抓取的网页进行预处理,找出专家页面。对于一个关键词的查询,首先在专家中查找,并排序返回结果。

    专家。在专家页面中只有一部分链接与主题相关。因此,把查询主题的专家中相关的外向链接合并,以找到查询主题相关页面高度认可的页面。

    从排名在前的匹配专家页面和相联系的匹配信息中选择专家页面中一个超链接的子集。尤其选择那些与所有的查询相关的链接。基于这些选中的链接找出一个它们的目标子集作为查询主题最相关的网页。这个目标子集包含至少被两个非亲属的专家页面链接到的网页。目标集根据指向它们的专家的综合成绩来排序。

    Hilltop在应用中还存在一些不足。专家页面的搜索和确定对算法起关键作用,专家页面的质量决定了算法的准确性;而专家页面的质量和公平性在一定程度上难以保证。Hiltop忽略了大多数非专家页面的影响。在Hiltop的原型系统中,专家页面只占到整个页面的1.79%,不能全面代表整个互联网。

    Hiltop算法在无法得到足够的专家页面子集时(少于两个专家页面),返回为空,即Hiltop适合于对查询排序进行求精,而不能覆盖。这意味着Hilltop可以与某个页面排序算法结合,提高精度,而不适合作为一个独立的页面排序算法。Hilltop中根据查询主题从专家页面集合中选取与主题相关的子集也是在线运行的,这与前面提到的HITS算法一样会影响查询响应时间。随着专家页面集合的增大,算法的可伸缩性存在不足之处。

    分析:HITS算法的优点在于它能更好地描述互联网的组织特点,由于它只是对互联网中的很小的一个子集进行分析,所以它需要的迭代次数更少,收敛速度更快,减少了时间复杂度。

    但HITS算法也存在如下缺点:中心网页之间的相互引用以增加其网页评价,当一个网站上的多篇网页指向一个相同的链接,或者一个网页指向另一个网站上的多个文件时会引起评分的不正常增加,这会导致易受“垃圾链接”的影响;网页中存在自动生成的链接;

    主题漂移,在邻接图中经常包括一些和搜索主题无关的链接,如果这些链接自身也是中心网页或权威网页就会引起主题漂移:对于每个不同的查询算法都需要重新运行一次来获取结果。这使得它不可能用于实时系统,因为对于上千万次的并发查询这样的开销实在太大。

算法三、Direct Hit

    算法与前面的算法相比,Ask Jeeves公司的Direct Hit算法是一种注重信息的质量和用户反馈的排序方法。它的基本思想是,搜索引擎将查询的结果返回给用户,并跟踪用户在检索结果中的点击。如果返回结果中排名靠前的网页被用户点击后,浏览时间较短,用户又重新返回点击其它的检索结果,那么可以认为其相关度较差,系统将降低该网页的相关性。另一方面,如果网页被用户点击打开进行浏览,并且浏览的时间较长,那么该网页的受欢迎程度就高,相应地,系统将增加该网页的相关度。可以看出,在这种方法中,相关度在不停地变化,对于同一个词在不同的时间进行检索,得到结果集合的排序也有可能不同,它是一种动态排序。

    分析:该算法的优点是能够节省大量时间,因为用户阅读的是从搜索结果中筛选出来的更加符合要求的结果。同时,这种算法直接融入用户的反馈信息,能够保证页面的质量。

    然而,统计表明,Direct Hit算法只适合于检索关键词较少的情况,因为它实际上并没有进行排序,而是一种筛选和抽取,在检索数据库很大、关键词很多的时候,返回的搜索结果成千上万,用户不可能一一审阅。因此,这种方式也不能作为主要的排序算法来使用,而是一种很好的辅助排序算法,目前在许多搜索引擎当中仍然在使用。

    其实对于网页的搜索排名,都是多种算法综合作用的结果,简单分析上面的三种算法,Pagerank可以给网站上的所有网页给予一个重要性的排序,但是没有针对性、相关性,而且现在PR值作弊已经到了一个泛滥的地步,所以PR就网页排名的重要性已经大为下降;

    Hilltop算法的提出,对于广大站长做外部链接建设,将起到指导作用。在Hilltop算法中,每个领域都会有若干专家页面,如果搜索相关关键词,搜索引擎首先会从专家页面查找,如果匹配度不够,再从专家页面链接的下一级页面查找,以此类推。

    Direct Hit算法可以作为Hilltop和pagerank很好的补充,Direct Hit更多的是,考虑了用户体验的影响,对搜索结果的质量,进行实时的更新,一个最符合搜索用户要求的页面,应该是用户从搜索框中点击页面链接开始,用户浏览网站超过一定时间,则被认为结果页面,更符合用户搜索的要求,长期有效的点击,页面在搜索引擎中排名,就会有相应的提高。

     通过以上三种算法,就可以明白,无论是做外链还是网站内容建设,首先需要考虑的就是相关性,在外链建设中,要努力寻找主题相关中,权威度高的网站,软文、友情链接等,都可以看作是这些网站,对你的支持,同时,注意网站的跳出率和浏览时间,时刻反馈用户数据,对一些重点页面,用户点击量较高的页面,做好相关性推荐,引导用户点击更多的页面。

    搜索引擎核心算法始终不会脱离这些内容,每次的算法更新都是从一些作弊源头经行改动,也正是因为搜索引擎算法的不断变化,也造就了很多正规网站的排名也越来越好做,尽管搜索引擎越来越完善,但始终会有人去研究搜索引擎漏洞来获取排名。

网站优化是指通过对网站功能、网站结构、网页布局、网站内容等要素的合理设计,使得网站内容和功能表现形式达到对用户友好并易于宣传推广的最佳效果,充分发挥网站的网络营销价值,是一项系统性和全局性的工作,包括对用户的优化、对搜索引擎的优化、对运营维护的优化。网站优化已经成为网络营销经营策略的必然要求。

网站优化可以从狭义和广义两个方面来说明。
(1)狭义的网站优化,即搜索引擎优化,也就是让网站设计得适合搜索引擎检索,满足搜索引擎排名的指标,从而在搜索引擎检索中获得靠前的排名,增强搜索引擎营销的效果。
网站优化的最终结果是要把网站的排名优化,而首先要做的是网站的内部优化,分析网页相关性。
(2)广义的网站优化所考虑的因素不仅仅是搜索引擎,也包括充分满足用户的需求特征、清晰的网站导航、完善的在线帮助等,在此基础上使得网站功能和信息发挥出最佳的效果,也就是以企业网站为基础,与网络服务商(如搜索引擎等)、合作伙伴、顾客、供应商、销售商等网络营销环境中各方面因素建立良好的关系。
网站优化是企业进军互联网必然的选择。通过对企业的网站进行网站优化(搜索引擎优化),使企业网站对搜索引擎更加友好,提高企业网站在搜索引擎中的排名,增强企业的宣传推广效果。搜索引擎优化,是影响客户网站在搜索引擎排名的最主要的因素。由于各个搜索引擎考虑的侧重点不同,所以在不同的搜索引擎上搜索出来的结果也是不同的。
从易用性来说,网站优化的原因有:最早的网站可能存在每当主流浏览器升级时,刚刚建立的网站就有可能过时的问题,这就需要升级或重新建造一遍网站;为了使网站兼容Netscape和IE,网站不得不为这两种浏览器提供不同的代码;每当新的网络技术和交互设备出现后,也需要制作新版本来支持这种新技术或设备,如支持手机上网的WAP技术;网站代码臃肿浪费了大量带宽。经过优化的网站文件下载与页面显示速度更快;内容能够被更多的用户所在地访问;当浏览器版本更新,或者出现新的网络交互设备时,确保所有应用能够继续正确执行。
从可维护性和搜索引擎优化的角度来说,网站优化的原因有:简洁的代码,大大降低了带宽的要求,加快了页面加载速度,使得网站更容易维护;有利于搜索引擎抓取,使得网站对于搜索引擎更加友好,有利于提高网站的排名等。
对于网站设计和开发人员来说,网站优化就是使用标准;对于用户来说,网站优化就是最佳体验。
网站优化

 

网站优化,SEO优化,关键词排名-搜索引擎营销推广城市导航:

北京 东城区 密云区 平谷区 怀柔区 房山区 昌平区 大兴区 顺义区 通州区 丰台区 石景山区 朝阳区 海淀区 西城区 延庆区
天津 和平区 津南区 西青区 东丽区 红桥区 南开区 河东区 河北区 河西区 北辰区
上海 黄浦区 奉贤区 青浦区 松江区 金山区 嘉定区 宝山区 闵行区 浦东新区 杨浦区 虹口区 普陀区 静安区 长宁区 徐汇区 崇明区
重庆 渝中区 大渡口区 江北区 沙坪坝区 九龙坡区 南岸区 北碚区 渝北区 巴南区
江苏 泗阳 海安 建湖 靖江 沛县 邳州 如东 泰兴 新沂 东台 丹阳 泗洪 昆山 金坛 姜堰 灌云 灌南 宝应县 兴化 扬中 东海 淮安 盐城 扬州 南通 徐州 常州 无锡 南京 连云港 泰州 海门 溧阳 启东 如皋 大丰 沭阳 镇江 宿迁 苏州
江西 南昌 永新 鹰潭 新余 景德镇 抚州 萍乡 上饶 吉安 宜春 九江 赣州 乐平
辽宁 沈阳 庄河 阜新 铁岭 葫芦岛 本溪 辽阳 丹东 朝阳 盘锦 营口 抚顺 锦州 鞍山 大连 瓦房店
内蒙古 呼和浩特 阿拉善盟 乌海 兴安盟 锡林郭勒 乌兰察布 巴彦淖尔市 呼伦贝尔 通辽 鄂尔多斯 赤峰 包头 海拉尔
宁夏 中卫 银川 吴忠 石嘴山 固原 青海 西宁 海西 海北 果洛 海东 黄南 玉树 海南
山东 青岛 寿光 龙口 曹县 单县 肥城 高密 广饶 桓台 莒县 蓬莱 青州 荣成 乳山 滕州 新泰 招远 邹城 诸城 垦利 济南 烟台 潍坊 临沂 淄博 济宁 泰安 聊城 威海 枣庄 德州 日照 东营 菏泽 滨州 莱芜 章丘 邹平
山西 太原 临猗 朔州 忻州 吕梁 阳泉 晋城 长治 晋中 运城 大同 临汾 清徐 陕西 西安 铜川 商洛 安康 延安 榆林 汉中 渭南 宝鸡 咸阳 神木
四川 成都 资阳 凉山 广元 雅安 巴中 阿坝 甘孜 安岳 广汉 简阳 广安 眉山 攀枝花 绵阳 德阳 南充 宜宾 自贡 乐山 泸州 达州 内江 遂宁 仁寿
西藏 拉萨 日喀则 山南 林芝 昌都
新疆 乌鲁木齐 和田 吐鲁番 博尔塔拉 克拉玛依 哈密 喀什 阿克苏 伊犁 巴音郭楞 昌吉 石河子
吉林 长春 四平 延边 松原 白城 通化 白山 辽源 公主岭
湖南 长沙 张家界 湘西 娄底 永州 怀化 邵阳 郴州 岳阳 湘潭 衡阳 常德 益阳 株洲 醴陵
广东 茂名 汕头 湛江 肇庆 云浮 汕尾 潮州 台山 阳春 顺德 惠东 博罗 江门 惠州 珠海 揭阳 梅州 清远 阳江 韶关 河源 深圳 广州 东莞 佛山 中山 海丰
浙江 杭州 象山 温岭 桐乡 慈溪 长兴 嘉善 海宁 德清 东阳 安吉 苍南 临海 永康 诸暨 余姚 宁波 温州 金华 嘉兴 台州 绍兴 湖州 丽水 衢州 舟山 乐清 瑞安 义乌 玉环
安徽 合肥 宣城 亳州 黄山 池州 巢湖 和县 霍邱 桐城 宁国 铜陵 马鞍山 芜湖 蚌埠 阜阳 淮南 安庆 宿州 六安 淮北 滁州 天长
福建 福州 南安 晋江 石狮 武夷山 龙岩 南平 三明 漳州 莆田 泉州 厦门 平潭
甘肃 兰州 嘉峪关 临夏 陇南 金昌 定西 武威 张掖 酒泉 平凉 庆阳 白银 天水 甘南
广西 南宁 防城港 贺州 来宾 河池 百色 钦州 贵港 北海 梧州 玉林 桂林 柳州 崇左
贵州 贵阳 黔西南 安顺 铜仁 毕节 六盘水 黔南 黔东南 遵义 仁怀
海南 海口 白沙 保亭 澄迈 定安 东方 陵水 琼中 屯昌 万宁 文昌 琼海 三沙 五指山 三亚 儋州
河北 石家庄 馆陶 张北 赵县 正定 迁安市 任丘 三河 武安 雄安新区 燕郊 定州 保定 唐山 廊坊 邯郸 秦皇岛 沧州 邢台 衡水 张家口 承德 涿州
河南 郑州 三门峡 鹤壁 济源 明港 鄢陵 禹州 长葛 灵宝 杞县 汝州 项城 偃师 漯河 驻马店 洛阳 新乡 南阳 许昌 平顶山 安阳 焦作 商丘 开封 濮阳 周口 信阳 长垣
黑龙江 哈尔滨 七台河 伊春 黑河 鹤岗 双鸭山 鸡西 佳木斯 绥化 牡丹江 齐齐哈尔 大庆 大兴安岭 
湖北 武汉 鄂州 随州 潜江 天门 仙桃 神农架 宜都 汉川 咸宁 荆门 宜昌 襄阳 荆州 十堰 黄石 孝感 黄冈 恩施 枣阳
云南 昆明 迪庆 临沧 保山 普洱 德宏 昭通 西双版纳 楚雄 文山 丽江 玉溪 红河 大理 曲靖 怒江
台湾 台北 基隆 高雄 台中 安平 台湾 台北 基隆 高雄 台中 安平
香港 
澳门