SEO怎么分析网站日志这些细节问题
阅读 · 发布日期 2020-12-31 09:36 · admin 作为一名SEO优化人员,对网站日志分析是必须要掌握的一项基本的技能,通过日志分析可以分析爬虫抓取页面有效性,通过日志分析蜘蛛返回的状态码能及时发现网站里面是否存在错误或者蜘蛛无法爬取的页面,网站建设排查网站页面中存在的404错误页面等。网站日志既可使用工具,也可直接在看。直接在看源文件,信息会更加完整。那么网站日志要分析哪些数据呢?
1、访问次数、停留时间、抓取量
从这些项数据中可以得知: 平均每欢抓取页面数、单页抓取停留时间和平均每次停留时间。平均每次抓取页面数=总抓取量/访问次数,单页面抓取停留时间=每次停留/每次抓取,平均每次停留时间=总停留时间访问次数。
2、目录抓取统计
通过日志分析我们可以看到网站哪些目录受蜘蛛喜欢、抓取目录深度、重要页面目录抓取状况、无效页面目录抓取状况等。通过对比目录下页面抓取及收录情况,我们可以发现更多问题。对于重要目录,我们需要通过内外调整增加权重及爬取; 对于无效页面,在Robots.TXT 中进行屏蔽。
3、蜘蛛爬取路径
在网站日志中我们可以跟踪到特定IP 的访问路径,网站建设如果我们跟踪特定蜘蛛的访问路径就能发现对于本网站结构下蜘蛛的爬取路径偏好。由此,我们可以适当地引导蜘蛛的爬取路径,让蜘蛛更多地爬取重要、有价值、新更新页面。其中,爬取路径中我们又可以分析页面物理结构路径偏好以及URL 逻辑结构爬取偏好。通过这些,可以让我们从搜索引擎的视角去审视自己的网站。
4、页面抓取
在网站日志分析中,我们可以看到具体被蜘蛛爬取的页面。在这些页面中,我们可以分析出蜘蛛爬取了哪些需要被禁止爬取的页面、爬取了哪些无收录价值页面、爬取了哪些重复页面URL等。为充分利用蜘蛛资源,我们需要将这些地址在Robots.txt中禁止爬取。
5、访问状态码
蜘蛛经常出现的状态码包括301、404等。出现这些状态码要及时处理,以避免对网站造成坏的影响。
6、抓取时间段
通过分析对比多个单日蜘蛛小时爬取量,可以了解到特定蝴蛛对于本网站在特定时间的活跃时段。通过对比周数据,可以看到特定蜘蛛在一周中的活跃周期。
7、蜘蛛访问IP
通过蜘蛛的IP段和前三项数据来判断网站的降权情况,IP分析的更多用途是判断是否存在采集蜘蛛、假蜘蛛、恶意点击蜘蛛等,从而对那些访问来源进行屏蔽、禁止访问处理,以节省带宽资源及减轻服务器压力,留给访客及蜘蛛更好的访问体验。
做优化时,一些细节问题可能也会关系到我们整个SEO优化的好坏结果,所以细节问题我们也不能忽视它。
1、网站图片是否清晰明了?
拿众多企业网站来举例,好多的企业网站中的图片都存在或多或少的问题,具体如下:大小不一,规格不一,图片清晰度极差,图片表现力说服力不强等等的缺点。
2、网站图片是否为原创
说到这可能很多朋友会抱怨了。现在网站内容要求原创已经够费力了,怎么网站图片也要求原创?其实从搜索引擎结果展现图文并茂的形式可以看出,搜索引擎对网站图片的识别已经越来越智能化了。
3、图片与文章的相关性
如果想要搜索结果以图文并茂的形式展现,必须为该页面配备符合主题的相关图片才能给予展现。除了这方面外,从网站内容而言,网站建设如果网站图片和网站内容毫无关联性,试问你又能否给予网站访客一个好的用户体验呢?所以网站图片优化也要注重相关性。
4、图片的格式和大小
众所周知,网站图片的格式有jpg、gif、png常见的三种格式。那么到底何种网站的图片是百度最喜欢的呢?很简单,我们可以看看百度官方发布的一些带图的文章,就不难发现png的格式就是更佳的格式。
1、访问次数、停留时间、抓取量
从这些项数据中可以得知: 平均每欢抓取页面数、单页抓取停留时间和平均每次停留时间。平均每次抓取页面数=总抓取量/访问次数,单页面抓取停留时间=每次停留/每次抓取,平均每次停留时间=总停留时间访问次数。
2、目录抓取统计
通过日志分析我们可以看到网站哪些目录受蜘蛛喜欢、抓取目录深度、重要页面目录抓取状况、无效页面目录抓取状况等。通过对比目录下页面抓取及收录情况,我们可以发现更多问题。对于重要目录,我们需要通过内外调整增加权重及爬取; 对于无效页面,在Robots.TXT 中进行屏蔽。
3、蜘蛛爬取路径
在网站日志中我们可以跟踪到特定IP 的访问路径,网站建设如果我们跟踪特定蜘蛛的访问路径就能发现对于本网站结构下蜘蛛的爬取路径偏好。由此,我们可以适当地引导蜘蛛的爬取路径,让蜘蛛更多地爬取重要、有价值、新更新页面。其中,爬取路径中我们又可以分析页面物理结构路径偏好以及URL 逻辑结构爬取偏好。通过这些,可以让我们从搜索引擎的视角去审视自己的网站。
4、页面抓取
在网站日志分析中,我们可以看到具体被蜘蛛爬取的页面。在这些页面中,我们可以分析出蜘蛛爬取了哪些需要被禁止爬取的页面、爬取了哪些无收录价值页面、爬取了哪些重复页面URL等。为充分利用蜘蛛资源,我们需要将这些地址在Robots.txt中禁止爬取。
5、访问状态码
蜘蛛经常出现的状态码包括301、404等。出现这些状态码要及时处理,以避免对网站造成坏的影响。
6、抓取时间段
通过分析对比多个单日蜘蛛小时爬取量,可以了解到特定蝴蛛对于本网站在特定时间的活跃时段。通过对比周数据,可以看到特定蜘蛛在一周中的活跃周期。
7、蜘蛛访问IP
通过蜘蛛的IP段和前三项数据来判断网站的降权情况,IP分析的更多用途是判断是否存在采集蜘蛛、假蜘蛛、恶意点击蜘蛛等,从而对那些访问来源进行屏蔽、禁止访问处理,以节省带宽资源及减轻服务器压力,留给访客及蜘蛛更好的访问体验。
做优化时,一些细节问题可能也会关系到我们整个SEO优化的好坏结果,所以细节问题我们也不能忽视它。
1、网站图片是否清晰明了?
拿众多企业网站来举例,好多的企业网站中的图片都存在或多或少的问题,具体如下:大小不一,规格不一,图片清晰度极差,图片表现力说服力不强等等的缺点。
2、网站图片是否为原创
说到这可能很多朋友会抱怨了。现在网站内容要求原创已经够费力了,怎么网站图片也要求原创?其实从搜索引擎结果展现图文并茂的形式可以看出,搜索引擎对网站图片的识别已经越来越智能化了。
3、图片与文章的相关性
如果想要搜索结果以图文并茂的形式展现,必须为该页面配备符合主题的相关图片才能给予展现。除了这方面外,从网站内容而言,网站建设如果网站图片和网站内容毫无关联性,试问你又能否给予网站访客一个好的用户体验呢?所以网站图片优化也要注重相关性。
4、图片的格式和大小
众所周知,网站图片的格式有jpg、gif、png常见的三种格式。那么到底何种网站的图片是百度最喜欢的呢?很简单,我们可以看看百度官方发布的一些带图的文章,就不难发现png的格式就是更佳的格式。