大部分人的SEO理念中,或多或少SEO从业者都会遇到一些在优化中很纠结的问题,而这些纠结的问题中,‘收录’是很多SEO从业者比较频繁遇见的的。我今天不讲外链和内链,只讲收录与排名,下面会使用案例给大家展示案例效果,如图所示:
SEO干货,快速排名靠前你不得不看!
SEO干货,快速排名靠前你不得不看!
该站上线是2016年11月中旬,文章截稿的时间大约一周左右,从整体站点页面的收录速度以及排名中可以看得出,蜘蛛的抓取频率是非常给力的。揭秘内页实战快速收录并且做到页面参与排名的方法之前,必须要告诉大家两个点:
第一、该站点所有文章均为抄袭,任意一篇文章的内容百度上都出现了多次,这打破了传统原创思维理念。
第二、这仅仅是一个刚上线的新站,并且没有使用任何所谓的蜘蛛池去吸引蜘蛛。
有很多朋友会问了:新站是如何做到快速收录,并且可以建立部分页面参与排名的?这个话题是本文的研究核心,如果大家也遇到了收录问题,那么至少有一点你没有做好:你一直在所谓的外链、内链、布局、原创内容而忘记了核心点---搜索引擎排名原理。
首先要想做好页面收录并且参与排名,我们要先思考下搜索引擎工作原理,别小看这种最最基础的东西,你领悟了核心要点,那么操作收录起来就会变得游刃有余,如下图所示:
SEO干货,快速排名靠前你不得不看!
百度百科中我们能看出,整个原理是从最初的爬行抓取--收录--建立索引--搜索词处理--排序,虽然就几个步骤,但是每个步骤都有他的核心要点。下面我将把整个核心要点给大家一一剖析。
一、爬行和抓取
首先我们要知道到搜索引擎蜘蛛要想爬行和抓取一个页面,你就必须要满足两个特点:第一、足够的外链;第二、网站更新频率。在百度站长平台里面每个站点都会有一个抓取频次,而抓取频次我们可以特定的看作站点受蜘蛛的喜爱程度,也可以通俗的理解站点抓取频次越高,那么你站点被蜘蛛喜爱程度就会越高,从而你的收录就会加快。如果使用蜘蛛池这类程序的同学,我想就应该非常清楚,但是很多朋友即使使用了蜘蛛池那也只是外部链接进行吸引蜘蛛,如果配上站点更新频率,效果更佳!
二、收录和索引
通肠大家会认为页面收录与页面建立索引无太大区别,其实不是,在整个站点页面文档中会有两种情况:
1、URL收录---是,索引---否;代表已经进入了索引,只是这个网页的“权重”非常非常低,可以视作是“无效索引”。
2、URL收录---是,索引---是;代表已经有资格参与排名,但是不保证100%能获取排名,可以视作是“有效索引”。
我们可以简单的去理解site出来的站点页面是被收录的,但不代表site出来的页面是被索引的。但是我们依然可以去检测出页面是否具备参与排名的资格,如下图所示:
SEO干货,快速排名靠前你不得不看!
Domain与Site最大的区别在于,Site可以统计页面收录,而Domain我们可以分析出站点外链域,而这里我们并不是去讨论外链域,而是仅仅使用Domain命令来检测站点能够参与排名的有效数值。
不过大家可以用一种非常简单的方法去快速检测你的页面是否有参与排名的资格,如下图所示:
SEO干货,快速排名靠前你不得不看!
SEO干货,快速排名靠前你不得不看!
SEO干货,快速排名靠前你不得不看!
上面图中我们可以把site出来的收录页面进行搜索查询,可以检测到页面是否被收录,但是当你搜索整个标题却没有排名,也就是前面我提到过的url收录---是 但是url索引---否,说明网页“权重”较低,并没有参与排名,那么我们再来看几张图,如下图所示:
SEO干货,快速排名靠前你不得不看!
SEO干货,快速排名靠前你不得不看!
SEO干货,快速排名靠前你不得不看!
从上图我们可以看得出,该页面不仅被收录还建立了索引,并且搜索整个标题可以检索到排名。从这点我们可以看出,索引的页面无需做任何外链、内链、甚至是抄袭的文章即可有参与排名的资格。那么问题来了,该如何进行有效的页面进行建立索引并建立起参与排名的资格?
很多人在思考一个问题,文章要尽量原创,满足用户需求,提高用户体验等等。但是为何有些站点收录非常好,排名也非常不错,文章却是采集或者伪原创。讲到建立索引以前,我们继续先把剩下的一个工作原理分析完毕。
三、检索和排名
在整个检索与排名中,会体现出最常用的两个搜索引擎原理,一个就是倒排索引,另外一个就是TF-IDF算法,首先我们来了解下倒排索引的更新策略,如下图所示(来自百度百科-倒排索引):
SEO干货,快速排名靠前你不得不看!
在整个倒排索引结构中,最常见的有四种更新策略,而上述的案例中就用到了其中两种,如果大家仔细的去观察我的每一个文章,就不难发现即使我的页面是纯抄袭文章,但是我抄袭的每一个标题和原来标题不相同,并且标题会更加的去符合页面内容,提升页面词频需求(TF-IDF)。其次则是抄袭的文章不会直接复制粘贴,我会进行重新排版,重构页面从而达到页面并非采集的作用。
在搜索引擎里面。有一个算法叫做TF-IDF算法,简单来说,TF-IDF算法,详细公式参考:http://www.cnblogs.com/biyeymyhjob/archive/2012/07/17/2595249.html是用来检索页面文档关键词出现的频次。并且可以通过该算法计算一个文件集合里面的词频出现的次数从而来评定一个页面的重要程度。而该重要程度是结合页面TITLE来计算,也就是大家常说的文章内容要符合页面标题的主题相关性,类似作文写作中的紧扣主题。
看到这里,我相信很多朋友就会理解为何蜘蛛池程序可以快速提升收录并且有部分页面进行参与排名,很大的一个特点就是蜘蛛的频繁抓取,从而建立了索引,在短时间内让页面“权重”提升,并且促进排名,而新闻站点的原理也是因为蜘蛛抓取频繁的特点,几乎无需发布任何的外链即可有很好的排名。
现在我们再来分析和思考整个页面的抓取到最终的检索排名我一共操作了是什么:
第一、大量的不定时更新,让蜘蛛抓取频繁抓取,建议给百度提交站点地图,定时更新站点地图。
第二、大量采集文章通过修改标题与布局重构让页面变得更新有新鲜度,满足更符合页面的用户需求。
第三、每天保持大量的更新让蜘蛛抓取形成习惯。
第四、由于该站是老域名,加上站点原始数据积累,可保持站点的权威度,从而相对新域名来说站点更加具备抓取优势。
写在最后:
虽然最后只写四点,也有很多SEO同学会觉得我说的这些没啥用,但是如果你真正领悟到我所提到的一些核心要点,那么你就不难发现SEO建立索引的奥妙所在,做SEO思路决定出路,技术并不是最重要的,我更加建议seo同学们可以多去了解搜索引擎的一些基础算法和百度官方优化指南文档,如果能够把里面的任何一个核心点通过实战的方式去吃透,会比你看任何所谓的SEO文章都要有价值!
该文章来自:知乎 作者:嗨赚族 https://zhuanlan.zhihu.com/p/23929372