摘要:关于百度索引量百度官方给出的解释:索引量仅指被百度搜索引擎建立了索引的网页总量,表示网站中有多少页面可以作为搜索候选结果,不同网页因内容重要性、稀缺性不同,被展现的几率有很大差别。
我们一直以百度的索引量作为SEO的参考,如图1所示,使用SITE命令查询到的索引项数即为索引量。百度站长工具上线后,推出了索引量查询工具。这两个数据有些区别,让很多SEOER很困惑如何查询百度收录量,不知道该参考哪个数据。下面CRAZYSEO工程师就来给大家深度解读一下这个问题。
图1 Wandouke站点命令结果
收藏量是指搜索引擎对网站页面的收藏数据,结合索引来说,就是蜘蛛先爬取网站,建立索引库,然后发布的页面数量就是收藏量,一般Site命令的数据查询结果就是收藏数据,这个数据不是很准确,作为参考指标。收藏量是指每个页面都会对应至少一个网页快照,快照页面参与SEO排名,所以收藏量越多,页面参与SEO排名越多,相对来说流量范围就越大。当然,能获得多少SEO流量,还要看页面的排名情况,以及关键词的热度。
由此我们可以看出,收录量是索引量的一个子集,只要搜索引擎蜘蛛抓取了网页就会对网页进行索引,而收录后并不一定就能发布索引结果。如果网站的收录量长期与索引量相差很大,说明该网站要注意内容的质量了。CRAZYSEO工程师在SEO诊断中经常会遇到这样的问题,有些站长的网站被蜘蛛抓取的速度非常快,文章发布后几分钟就进入索引库,但是这些索引只有很少一部分被发布,分析后发现这些文章都是经过简单的伪原创后才被收录发布的,这就是收录量一直得不到提升的原因。
因此,通过收录量和索引量对比,我们可以分析出网站内容是否合格,例如图2是CRAZYSEO工程师个人网站的收录量,图3是索引量,两者的引用量完全一致,说明CRAZYSEO工程师发表的每一篇文章,都被搜索引擎成功收录。
图2 axingweb站点命令结果
图3 百度站长工具索引量
关于百度索引量,百度官方给出的解释是:索引量仅指被百度搜索引擎收录的网页总数,表示网站内有多少页面可以作为候选搜索结果。不同的网页由于其内容的重要性和稀缺性,被展示的机会是不同的。
索引量是蜘蛛抓取并整理网站内容页面形成的数据库,网站页面越多,数据库应该越大。百度现在有官方工具可以查询网站索引量数据,这个数据比较准确,虽然和SEO没有直接关系,但对收录还是有一定的指导作用。
从SEO角度来说,索引量是第一步,蜘蛛抓取网站并建立索引页;收录是第二步,蜘蛛根据页面内容、权重等因素发布网站快照页面,从而参与关键词排名;第三步是关键词排名优化,力图获得更多的SEO流量。
一般来说,索引量大于收录量(如图4所示),特别是新站,刚开始面临审核周期,索引量不断增加,而收录量却很难增加如何查询百度收录量,这需要一定的时间。但是当索引量远高于收录量时,就要引起注意了,应该是文章内容出现了问题,这时候就要增加原创文章的更新,尽量减少转载,尤其是一些低质量内容的转载。
图4 百度站长工具索引量
索引量小于收录量的情况也很多,我的网站现在就是这个样子,索引数据在4000左右,收录数据快5000了。这个可能是数据不准导致的,也可能是索引页面发布得好,对应多个快照页面,导致收录数据高于索引。需要注意的是两个数据不要相差太多,如果相差太大,一般网站有问题。有人可能会说我网站的索引量和收录量一模一样,所以没问题,其实收录数据(Site命令)是实时变化的,并不是很准确,如果索引量和收录量一模一样,我只能说是巧合。
索引量和收录数据在一定程度上可以反映出蜘蛛对网站的喜好和信任程度,单纯看这两个数据是不够的,还需要结合网站的页面数量、快照的更新时间、网页的收录时间等,通过综合数据表现,可以发现网站的潜在问题,评估工作内容的有效性以及下一步的工作重点。
索引量一般由网站的页面数量决定,如果想持续增加索引量,就需要打造优质的页面内容,持续吸引蜘蛛爬虫。如果索引数据波动较大,那么蜘蛛爬虫的数量和频率也会随之变化,这种变化是相关的,收录量也会随着索引量的增加而增加。两者的数据可能不一致,但变化趋势应该是一致的。这个数据趋势可以反映出网站当前的状态,对后续的SEO工作有很大的指导作用。
CRAZYSEO工程师建议读者在日常SEO优化中养成分析这些数据的习惯,这些数据背后往往隐藏着很大的问题,收录量大于指数量或者收录量小于指数量,都对应着网站存在问题,在以后的SEO过程中应该针对这些问题进行调整,这是SEO的最高境界。