做SEO的童鞋们都清楚,网站收录是一个网站能够获得排名的基础,网站内容被搜索引擎收录,它才有可能在这个搜索引擎里获得排名,这是先决条件。网站收录是什么?
打个比方,一个高中生要在全国高考获得名次,不是ta成绩多好就行,而是首先要报名,报名之后信息录入高考生档案,ta才有了参与高考排名的机会。至于ta能考多少名,这才取决于ta的成绩。网站收录是搜索引擎蜘蛛对一个网页进行爬取后,将页面内容数据放入搜索引擎数据库中这一结果。这个数据库是临时的,这从网站收录的动态变化可以看出。至于怎么查询收录量,有多个办法,一种是直接搜索框里输入指令,如查博客的收录。
然后我们尝试一下用站长工具查询博客的收录,在线网页工具地址:tool.chinaz.com。
我们发现,显示最新收录量为3050。相比于site指令查询到的,数据差距有点大,那么哪种方式查询的是准确的呢?
我们可以用百度搜索资源平台的工具来查一下索引。
如图显示9月7日最新索引量为2276,大于1818,小于3050。根据搜索引擎爬行→抓取→收录→索引→排名的流程,可以看出,网站收录量基本是大于等于索引的。这表明站长工具的数据更加精确一些。因此我也一直都是建议大家使用站长工具查询网站收录量。
这里提一下,site指令并不是因为数据不准确就没什么作用了。
site指令查出来的收录量基本上是一个预估值,个人以为site+域名这个操作最有用的功能是让你随时查看网站收录是否出现问题,做到快速反应,具体细节数据需要更精细的工具支持后续操作。
查询到网站的收录后,我们发现网站收录数量很少,想增加网站收录该怎么办呢?
总结为两个:广度以及深度。
广度比较好理解,增加链接入口,广撒网,无论站内站外,大致有:百度搜索资源平台的普通收录,也就是主动提交链接给搜索引擎,第三方平台网站的外链引入,站内的sitemap,各级导航、面包屑导航,相关推荐,超链接等。
深度不是指网站结构,网站结构在SEO方面是越浅越好。深度指的是页面内容的深度,只有优质的页面内容才具有收录的价值。
关于这方面,我想向大家解释一点,并不是原创就一定会收录,转载复制就一定不会收录或者被判定为页面质量低下,这是很多SEOer的误区。网站的收录是一个动态变化的过程,判定一个页面,一篇文章是否有价值,绝对不是看其是否原创。没有价值的原创,收录之后也可能会被再次释放出数据库。而有价值的转载,被证明其价值之后亦会被纳入索引。这里的知识点,大家可以细品。
当然,如果你整站都是转载,那你头不是一般的铁。
如果网站的收录出现问题了该怎么处理?
看过上文的应该知道了吧,检查自己的网站有没有服务器、数据库等网站本身的问题。排查之后,只需要把上面说的广度和深度的内容照着做就行了。
写到这里,我突然想到几天前一个企业的leader问的一个问题,涉及到蜘蛛池。