关键词挖掘工具:金花关键词工具
金花关键词工具主要是为了方便用户更加准确的查找最适合的关键词,比如查找竞争度小,百度搜索量大,转化率高的词,或者百度指数不高,但是转化率很高,SEO优化难度也不大的关键词,等等。
作为一款SEO工具,最注重的就是关键词分析和挖掘、长尾关键词提取功能,只做最好用的关键词工具,就是我们最简单的目标。

功能解释
1、“相关词数”功能解释:相关词数是用来程序查询百度指数和相关关键词数量的最大搜索词数,一般推荐使用默认值“20”,相关词数越大,搜索时间越长。
特别提示:查询50个相关关键词大约需要1-2分钟,查询200个关键词大约需要5-10分钟,词数越多查询时间越长。推荐大家选择“相关词数”时用20或者50个词最合适。
2、“首页数”功能解释:竞争度的显示范围是:0 - 100,百度查询某个关键词,前100个搜索结果中有多少个首页,其中排名前十中的百度网站内页也算作一个首页竞争。(原名称竞争度)
3、“查询延迟”功能解释:这是每次查询百度服务器所设的时间间隔,时间间隔越大搜索速度越慢,被百度封IP的可能性越小,反之亦然。建议:查询20个关键词时延时设置为200,查询100个关键词时延时设置为1000。延时1000 = 1秒钟,延时200 = 0.2秒。
4、“必须包含”功能解释:当文本框的内容为空时,所有的关键词都不过滤,直接加入查询队列。当为任意文字时,则表示找到的关键词必须包含这个文字,否则直接丢弃。
小技巧:当必须包含的关键词为:“ABC CBD”(中间是空格)时,只要包含“ABC”或者“CBD”都算有效,当必须包含的关键词为:“ABC&CBD”时,同时包含“ABC”且包含“CBD”才算有效。“ ”(空格) 和 “&”不可同时使用。
5、“显示长尾”功能解释:如果你打算做长尾关键词优化,请选择“是”,程序将显示所有查询到的相关关键词数据;选择“否”,则显示小于或等于“相关词数”准确查询到百度指数的关键词。
6、“指数批量查询”功能解释:本功能主要用于在已经有准备好所有关键词的情况下查询百度指数和竞争度。点击后将切换输出窗口,在左下角的文本框中输入要查询的关键词,并使用“,”(逗号或者分行)分隔每个关键词即可批量查询百度指数。在批量查询百度指数过程中,不可以同时查询百度相关关键词。
7、“隐藏”按钮功能解释:打开“百度指数批量查询”功能后,在原“百度指数批量查询”按钮的右边会出现“隐藏”按钮,本按钮主要用来切换回相关关键词查询模式。
8、“百度指数”功能解释:最新指数就是“最新的百度指数”。“最近7天”和“最近30天”是指最近7天的百度指数总和,最近30天的百度指数总和。
9、“相关页”功能解释:即这个关键词在百度上搜索,会有多少个搜索相关结果页。
10、“广告数”功能解释:即这个关键词在百度上搜索,会有多少个广告显示在搜索结果里。
11、“KR”功能解释:KR是关键词竞争度等级,数值0-10,越大优化越难。
12、“KPI”功能解释:KPI是关键词价值度,数值0-10,越大越有商业价值。
13、超级长尾模式:本功能主要用于查询大量长尾关键词,最大支持50万。数据越多越占CPU和内存。
14、多选模式:本功能主要用户针对某个搜索引擎提取关键词,可独立选择“淘宝”、“google”等。由于程序界面空间不足,所以将多选按钮和“是否显示长尾”、“相关词数”重叠了,如果想给多选模式设置“是否显示长尾”、“相关词数”这两个功能,请先点击“正常模式”,设置好,再换回“多选模式”
15、百度即时搜索关键词模式:主要获取百度即时搜索数据,让你知道大家在百度搜什么词。
16、正常模式:用于切换回原始打开状态。
下载:
下载文件 (已下载 1562 次)
相关文章:
网站优化推广方法汇总:长尾关键词部署实战
网站优化推广方法汇总:长尾关键词部署实战(二)
网站优化推广方法汇总:长尾关键词部署实战(三)
网站优化推广方法汇总:长尾关键词部署实战(四)
金花关键词工具主要是为了方便用户更加准确的查找最适合的关键词,比如查找竞争度小,百度搜索量大,转化率高的词,或者百度指数不高,但是转化率很高,SEO优化难度也不大的关键词,等等。
作为一款SEO工具,最注重的就是关键词分析和挖掘、长尾关键词提取功能,只做最好用的关键词工具,就是我们最简单的目标。
功能解释
1、“相关词数”功能解释:相关词数是用来程序查询百度指数和相关关键词数量的最大搜索词数,一般推荐使用默认值“20”,相关词数越大,搜索时间越长。
特别提示:查询50个相关关键词大约需要1-2分钟,查询200个关键词大约需要5-10分钟,词数越多查询时间越长。推荐大家选择“相关词数”时用20或者50个词最合适。
2、“首页数”功能解释:竞争度的显示范围是:0 - 100,百度查询某个关键词,前100个搜索结果中有多少个首页,其中排名前十中的百度网站内页也算作一个首页竞争。(原名称竞争度)
3、“查询延迟”功能解释:这是每次查询百度服务器所设的时间间隔,时间间隔越大搜索速度越慢,被百度封IP的可能性越小,反之亦然。建议:查询20个关键词时延时设置为200,查询100个关键词时延时设置为1000。延时1000 = 1秒钟,延时200 = 0.2秒。
4、“必须包含”功能解释:当文本框的内容为空时,所有的关键词都不过滤,直接加入查询队列。当为任意文字时,则表示找到的关键词必须包含这个文字,否则直接丢弃。
小技巧:当必须包含的关键词为:“ABC CBD”(中间是空格)时,只要包含“ABC”或者“CBD”都算有效,当必须包含的关键词为:“ABC&CBD”时,同时包含“ABC”且包含“CBD”才算有效。“ ”(空格) 和 “&”不可同时使用。
5、“显示长尾”功能解释:如果你打算做长尾关键词优化,请选择“是”,程序将显示所有查询到的相关关键词数据;选择“否”,则显示小于或等于“相关词数”准确查询到百度指数的关键词。
6、“指数批量查询”功能解释:本功能主要用于在已经有准备好所有关键词的情况下查询百度指数和竞争度。点击后将切换输出窗口,在左下角的文本框中输入要查询的关键词,并使用“,”(逗号或者分行)分隔每个关键词即可批量查询百度指数。在批量查询百度指数过程中,不可以同时查询百度相关关键词。
7、“隐藏”按钮功能解释:打开“百度指数批量查询”功能后,在原“百度指数批量查询”按钮的右边会出现“隐藏”按钮,本按钮主要用来切换回相关关键词查询模式。
8、“百度指数”功能解释:最新指数就是“最新的百度指数”。“最近7天”和“最近30天”是指最近7天的百度指数总和,最近30天的百度指数总和。
9、“相关页”功能解释:即这个关键词在百度上搜索,会有多少个搜索相关结果页。
10、“广告数”功能解释:即这个关键词在百度上搜索,会有多少个广告显示在搜索结果里。
11、“KR”功能解释:KR是关键词竞争度等级,数值0-10,越大优化越难。
12、“KPI”功能解释:KPI是关键词价值度,数值0-10,越大越有商业价值。
13、超级长尾模式:本功能主要用于查询大量长尾关键词,最大支持50万。数据越多越占CPU和内存。
14、多选模式:本功能主要用户针对某个搜索引擎提取关键词,可独立选择“淘宝”、“google”等。由于程序界面空间不足,所以将多选按钮和“是否显示长尾”、“相关词数”重叠了,如果想给多选模式设置“是否显示长尾”、“相关词数”这两个功能,请先点击“正常模式”,设置好,再换回“多选模式”
15、百度即时搜索关键词模式:主要获取百度即时搜索数据,让你知道大家在百度搜什么词。
16、正常模式:用于切换回原始打开状态。
下载:

相关文章:
网站优化推广方法汇总:长尾关键词部署实战
网站优化推广方法汇总:长尾关键词部署实战(二)
网站优化推广方法汇总:长尾关键词部署实战(三)
网站优化推广方法汇总:长尾关键词部署实战(四)
SEO案例分享:404页面的重要性
该网站百度收录比较快

该站 前2个 标题一样,第二篇是一个文章页面!
这就造成了标题重复
打开第二个页面是删除的页面
但标题和首页一样
没有设置404 (404页面该怎么做?)
显示是这样:文件不存在或已被删除
搜索引擎就认为 这个页面存在
如果删除的页面多
就会造成大量重复标题
影响排名
所以 我们要设置 404页面!
该网站百度收录比较快
该站 前2个 标题一样,第二篇是一个文章页面!
这就造成了标题重复
打开第二个页面是删除的页面
但标题和首页一样
没有设置404 (404页面该怎么做?)
显示是这样:文件不存在或已被删除
搜索引擎就认为 这个页面存在
如果删除的页面多
就会造成大量重复标题
影响排名
所以 我们要设置 404页面!
数据分析:日志分析方法概述
前面我提到过【SEO要学会数据分析很重要】,大家可以先了解一下,还有要用的日志分析工具【《光年SEO日志分析系统2.0》免费下载 】。
日志在计算机系统中是一个非常广泛的概念,在SEO分析中也非常重要。任何程序都有可能输出日志:操作系统内核、各种应用服务器等等。日志的内容、规模和用途也各不相同,很难一概而论。
本文讨论的日志处理方法中的日志,仅指Web日志。其实并没有精确的定义,可能包括但不限于各种前端Web服务器——apache、lighttpd、tomcat等产生的用户访问日志,以及各种Web应用程序自己输出的日志。
在Web日志中,每条日志通常代表着用户的一次访问行为,例如下面就是一条典型的apache日志:
211.87.152.44 – - [18/Mar/2005:12:21:42 +0800] “GET / HTTP/1.1″ 200 899 “http://www.baidu.com/” “Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; Maxthon)”
从上面这条日志中,我们可以得到很多有用的信息,例如访问者的IP、访问的时间、访问的目标网页、来源的地址以及访问者所使用的客户端的UserAgent信息等。如果需要更多的信息,则要用其它手段去获取:例如想得到用户屏幕的分辨率,一般需要使用js代码单独发送请求;而如果想得到诸如用户访问的具体新闻标题等信息,则可能需要Web应用程序在自己的代码里输出。
为什么要分析日志
毫无疑问,Web日志中包含了大量人们——主要是产品分析人员会感兴趣的信息,最简单的,我们可以从中获取网站每类页面的PV值(PageView,页面访问量)、独立IP数(即去重之后的IP数量)等;稍微复杂一些的,可以计算得出用户所检索的关键词排行榜、用户停留时间最高的页面等;更复杂的,构建广告点击模型、分析用户行为特征等等。
既然这些数据是如此的有用,那么当然已经有无数现成的工具可以帮助我们来分析它们,例如awstats、Webalizer,都是专门用于统计分析Web服务器日志的免费程序。
另外还有一类产品,它们不分析直接日志,而是通过让用户在页面中嵌入js代码的方式来直接进行数据统计,或者说我们可以认为它是直接让日志输出到了它们的服务器。典型的代表产品——大名鼎鼎的Google Analytics,另外还有国内的cnzz、百度统计等。
很多人可能会说,既然如此,我们为什么还需要自己来分析日志,有必要吗?当然有。我们的用户(产品分析人员)需求是无穷尽的,上面说的这几类工具虽然很好很强大,但显然没办法满足全部的需求。
无论是本地分析的工具,还是在线的分析服务,它们虽然提很丰富的的统计分析功能,可以做一定程度的配置,但是依然很有限的。要进行稍复杂点的分析,或者要做基于日志的数据挖掘,依然需要自己来完成。
另外绝大多数日志分析工具都是只能用于单机的,数据量稍大就没辙了。同时那些提供在线分析的服务对于单个站点通常也都有最大流量的限制——这是很容易理解的,他们也需要考虑服务器的负载。
所以,很多时候还是得靠自己。
怎么进行日志分析
这并不是一个简单的问题。即使我们把“日志”限定为Web日志,依然包含了成千上万种可能的格式和数据,而是“分析”更是难以定义,也许是简单的统计值的计算,也许是复杂的数据挖掘算法。
下面并不打算讨论这些复杂的问题,而只是笼统的讨论如何构建进行日志分析工作的基础。有了这些基础会让基于日志的简单统计分析变得很简单,并让复杂的分析挖掘等变得可行。
前面我提到过【SEO要学会数据分析很重要】,大家可以先了解一下,还有要用的日志分析工具【《光年SEO日志分析系统2.0》免费下载 】。
日志在计算机系统中是一个非常广泛的概念,在SEO分析中也非常重要。任何程序都有可能输出日志:操作系统内核、各种应用服务器等等。日志的内容、规模和用途也各不相同,很难一概而论。
本文讨论的日志处理方法中的日志,仅指Web日志。其实并没有精确的定义,可能包括但不限于各种前端Web服务器——apache、lighttpd、tomcat等产生的用户访问日志,以及各种Web应用程序自己输出的日志。
在Web日志中,每条日志通常代表着用户的一次访问行为,例如下面就是一条典型的apache日志:
211.87.152.44 – - [18/Mar/2005:12:21:42 +0800] “GET / HTTP/1.1″ 200 899 “http://www.baidu.com/” “Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; Maxthon)”
从上面这条日志中,我们可以得到很多有用的信息,例如访问者的IP、访问的时间、访问的目标网页、来源的地址以及访问者所使用的客户端的UserAgent信息等。如果需要更多的信息,则要用其它手段去获取:例如想得到用户屏幕的分辨率,一般需要使用js代码单独发送请求;而如果想得到诸如用户访问的具体新闻标题等信息,则可能需要Web应用程序在自己的代码里输出。
为什么要分析日志
毫无疑问,Web日志中包含了大量人们——主要是产品分析人员会感兴趣的信息,最简单的,我们可以从中获取网站每类页面的PV值(PageView,页面访问量)、独立IP数(即去重之后的IP数量)等;稍微复杂一些的,可以计算得出用户所检索的关键词排行榜、用户停留时间最高的页面等;更复杂的,构建广告点击模型、分析用户行为特征等等。
既然这些数据是如此的有用,那么当然已经有无数现成的工具可以帮助我们来分析它们,例如awstats、Webalizer,都是专门用于统计分析Web服务器日志的免费程序。
另外还有一类产品,它们不分析直接日志,而是通过让用户在页面中嵌入js代码的方式来直接进行数据统计,或者说我们可以认为它是直接让日志输出到了它们的服务器。典型的代表产品——大名鼎鼎的Google Analytics,另外还有国内的cnzz、百度统计等。
很多人可能会说,既然如此,我们为什么还需要自己来分析日志,有必要吗?当然有。我们的用户(产品分析人员)需求是无穷尽的,上面说的这几类工具虽然很好很强大,但显然没办法满足全部的需求。
无论是本地分析的工具,还是在线的分析服务,它们虽然提很丰富的的统计分析功能,可以做一定程度的配置,但是依然很有限的。要进行稍复杂点的分析,或者要做基于日志的数据挖掘,依然需要自己来完成。
另外绝大多数日志分析工具都是只能用于单机的,数据量稍大就没辙了。同时那些提供在线分析的服务对于单个站点通常也都有最大流量的限制——这是很容易理解的,他们也需要考虑服务器的负载。
所以,很多时候还是得靠自己。
怎么进行日志分析
这并不是一个简单的问题。即使我们把“日志”限定为Web日志,依然包含了成千上万种可能的格式和数据,而是“分析”更是难以定义,也许是简单的统计值的计算,也许是复杂的数据挖掘算法。
下面并不打算讨论这些复杂的问题,而只是笼统的讨论如何构建进行日志分析工作的基础。有了这些基础会让基于日志的简单统计分析变得很简单,并让复杂的分析挖掘等变得可行。
淘宝店铺如何提升店铺销量
一天,我坐在大办公室的窗户前,那片午后的阳光里。懒洋洋的~ 阳光就那么温柔的洒在周围,让我满心满脑想的都是些温暖的事情。 而这些想法,好像没有领头的马群,在脑海里横冲直撞的,没有个 发泄的地方,也没有个统一的轨道…
直到阿卡兴冲冲的跑过来……她的脸色红扑扑的,好像是某种兴奋冲击着她的心情。双手把一本书捧在怀里,然后,像送出一件无比珍贵的礼物一样,把书递给了我。 看见封皮的一瞬间,刚刚那些温暖的念头,突然间就被整合起来,凝成一只手,轻轻的在心底搔了一下~痒痒的~
我想,做一个这样的娃娃……
在这里下载
http://u.115.com/file/cltcntfh#Download
如何提升店铺销量.rar
一天,我坐在大办公室的窗户前,那片午后的阳光里。懒洋洋的~ 阳光就那么温柔的洒在周围,让我满心满脑想的都是些温暖的事情。 而这些想法,好像没有领头的马群,在脑海里横冲直撞的,没有个 发泄的地方,也没有个统一的轨道…
直到阿卡兴冲冲的跑过来……她的脸色红扑扑的,好像是某种兴奋冲击着她的心情。双手把一本书捧在怀里,然后,像送出一件无比珍贵的礼物一样,把书递给了我。 看见封皮的一瞬间,刚刚那些温暖的念头,突然间就被整合起来,凝成一只手,轻轻的在心底搔了一下~痒痒的~
我想,做一个这样的娃娃……
在这里下载
http://u.115.com/file/cltcntfh#Download
如何提升店铺销量.rar
搜索引擎如何判断链接价值的 17 个因素?
搜索引擎是怎样给某个网页排名的,为什么你推荐的这些 SEO 改动会对排名的变动有影响,你在哪儿学的 SEO,你能不能给列一下你做一些比较好的 SEO 案例?当你进的项目进行到一定深度时,就会开始进行链接建设了。客户想知道为什么链接建设那么重要?你就拉出那张“影响网站排名的因素”给他看,指出外链在影响网站搜索引擎排名所占的比重后,他们就会明白了,不过他们又有了另一个问题:
在网页搜索引擎排名上,Google 是怎样决定某个链接带给这个网页多少排名分值呢?
让我们来详细回答一下这个问题。你会发现很多最重要的影响搜索引擎判断一个链接价值的因素和分析。
开始前,有一个很重要的概念需要说说:
可能你注意到了,搜索引擎已经越来越依赖对整个网站的评估多于对某个网页的评估。这就是有时你会看到某些新网页或者只有很少链接的网页排名却很高,仅仅因为它们是在一个重要的、被信任的和外链极好的网站(域名)上。在有关影响搜索引擎排名的因素调查中,我们称之为“网站的权威性”,而且这个因素被 Google 算法(按照投票集合的观点)认为是最重要的。网站(域名)权威性可能基于网站链接图来计算的,而不是基于网页的链接图,下面的列表里,一些标准可能只影响上面其中之一,一些则两个都影响。
#1 – 内部链接 VS 外部链接
当搜索引擎首次通过评价链接到的网页的受欢迎程度、重要性和相关性来判断链接的价值时,它们发现了经典的基于引用的规则——就是指其他人说你好顶过你自卖自夸说千句好要重要,也更可信。因此,内部链接虽然也会带来某些分值和权重,但外部链接带来的要多得多。
当然,这并不意味着好的内部链接架构就不重要了,或者说对内部链接做的一切(有好的锚文本,去掉不需要的链接等等)不重要了,只是说一个网站或某个网页的在排名上的表现高度依赖别的网站怎样引用和评价它们。
#2 – 锚文本
对 SEO 们来说,很明显,锚文本在搜索引擎排名公式中是最重要的因素之一,所以不要奇怪在链接的众多属性中,搜索引擎特别关照这个定位文本的属性。
我们的实验(和以往很多经验)显示,“完全匹配”的定位文本比那些只是被包含着目标关键字的定位文本要来的有益的多。个人观点,搜索引擎不会远离这个标准,尤其对于那些通用(不含品牌的)的关键短语来说,这也是造成很多对 SERPs(搜索结果页面)过于优化和修饰的原因。
#3 – PageRank
无论这个页面排名叫什么,微软叫 StaticRank,Yahoo 叫 WebRank,Google 叫 PageRank,这些都是基于一种递归的、基于马尔可夫链的链接分析算法,是所有搜索引擎排名系统的一部分。PageRank 等排名系统使用的是一种投票的算法,而且和投票网页的影响力和多少有关。
关于 Pagerank 有几点很很重要的基本概念需要知道:
每个网址天生就都被分配了一些数量的 PageRank。
如果一个网页有“n”个链接,每个链接传递出去的页面排名被那个网页的页面排名除于“n”(一个网页上链接越多,那个网页上每个链接传递出去的 PageRank 就越低)
一种通过多次的迭代算法用来计算网络的整个链接图的流向,并以此计算出某个网址的排名分数。
在 Google 的工具条上的 PageRank 数值是指数形式的页面排名,所以页面排名 4 比页面排名 3 要重要 8-10 倍。
页面排名可以通过页面层次的链接图来计算,并给出某个单独的网址 PageRank,但是页面排名也可以通过在网站(域名)级别的链接图来计算,通过计算网站间的链接来决定网站的重要性和排名。
#4 – 信任排名机制
关于信任排名机制的基本概念,请参考斯坦福的论文 – 用信任排名打击网络垃圾。信任排名的基本观点就是互联网上“好的”和“值得信赖”的网页都紧密的链接在一起,然后让垃圾网页只能在这个核心外游荡。因此,通过迭代算法和类似于页面排名的衡量标准让只有来自信任网站的源传递更多的排名权重。信任排名可以用来预报某个网页的质量高低和是否是垃圾网页。
当搜索引擎不披露有关这个衡量标准的相关数据时,有可能某种“距离可信赖信息源距离“的公式应用在页面排名的算法中。另一个有趣的地方是还有一个叫反-信任排名的指标,这个指标用来检测谁链接到那些已知的垃圾站点上,这个可能也是影响排名的一个因素。页面排名和信任排名(以及反-信任排名,reverse-trustrank)都可以在页面层面级别和网站级别来计算排名。
从以上可以直觉地得到一点:从可以信赖的网站得到外链,而且不要链接到垃圾网站。
#5 – 域名权威性
虽然“域名权威性”经常可以在 SEO 界看到(比如域名权威性在影响网站排名的因素中占有很大比重),但是一个正式的、通用的定义却还没有。大多数人都用它来描述搜索引擎根据一个网站的链接数据得来的综合链接广泛度、网站的重要性和可信赖程度。(可能有些搜索引擎还综合一个域名存在的年限因素)
搜索引擎可能通过计算链接并定量地使用评分的方法来确定一个域名(网站)的权威性,而不是只用含糊的言语来描述,所以这是一个值得留意的数据。同时,你从获得外链的域名得到的排名权重可能比单独网页得到的要重要(或重要的多)。
#6 – 外链链接源的多元性
在我们对相关数据的分析后发现,没有哪个因素比来自网站根部的外链对排名的影响大。这显示出这是一个很难控制垃圾网站的指标也显示出外链的重要性和广泛性。
虽然没有因果关系,但很多 SEO 都经验主义地建议你外链网站的多样性对你网站/网页的排名有好处。根据这个逻辑,从一个曾经已经链接到你网站再得到链接比从一个全新的网站得到链接相比,对你的排名提升没有任何价值。这同时说明,从那些本来就多样性的网站得到的链接比那些低多样性网站得到的链接有价值的多。
#7 – 外链来源和目标的唯一性
搜索引擎有自己的一套办法来判定和预测网站间的关系和拥有关系。这包括(但不限于):
大量的共享和反向链接
域名注册数据
共享域名主机 IP 地址或 IP地址的 C 段
公开的收购和关联交易信息
机器可以阅读的公开市场协议
如果搜索引擎判断两个网站间预先存在某种关系,那么可能会对两个网站间链接的“编辑性”质量做抑制处理,它们可能会选择降低分数或干脆忽略这些链接。传闻在这种“网络”中的链接传递很小的价值(尤其是利用经典的“网站范围”建设链接策略形成的链接)。
#8 – 链接在页面上的位置
微软是第一个披露搜索引擎如何处理“区块层级”的(参见微软研究所的文章VIPS : Vision-based Page Segmentation Algorithm基于视觉的网页页面区域算法)。
从那以后,许多 SEO 都报告他们在 Google 和 Yahoo!发现了同样的效果和影响。对于我们也一样,比如,在内部链接中,页脚上的链接不可能提供和页面顶部导航链接一样的效果。还有报告说,为了与不断泛滥的链接广告做斗争,搜索引擎们都降低了从边栏和页脚来的外部链接的分值(价值)。
SEO 们都趋于同意一点:从网页页面“内容”部分来的链接是最有价值的,不管从排名价值来说还是从点击流量来说。(关于页面优化和关键字定位,请参考:网页搜索引擎优化和关键字定位指南)
#9 – 主题相关性
搜索引擎有很多方法对两个网页(网站)进行内容主题分析并判断网页(网站)间是否类似和相关。几年前,Google 实验室推出一项自动分类工具,可以根据 URL(网址)来预测任何虚拟内容的分类和子分类(包括医疗、房地产、市场营销和运动等 10 多个分类)。有可能搜索引擎会使用这种自动主题分类系统来判断网页和链接的“相邻性”,并作为提高网页(网站)排名质量的一项额外措施。
我本身并不担心主题相关性的有关问题,如果你从一个和主题无关的站点( 比NYTimes.com)或一个主题明确的博客得到一个外链,我想这可能对你的排名有好处。我感觉这可能是搜索引擎为了防止垃圾链接或作弊行为说采取的一种分析手段。
#10 – Content & Context Assessment 内容和上下文评估
虽然主题相关性能给搜索引擎提供链接间关系的有用信息,那么可能源链接所在的网页页面内容和上下文更能提供用于决定此链接传给目标网页的价值。在内容和上下文分析里,搜索引擎会通过机器分析/分词来分析和辨析为什么这个链接会存在在这个网页上。
当链接被特意编辑,产生某种模式。链接通过可接受的 HTML 规范、字词用法、措辞等,嵌入到内容中,指向相关的内容来源。通过详细的模式匹配(有可能通过学习大量的数据),搜索引擎可能会分辨出“符合规范的”和“特意编辑”的链接与故意隐藏的(通过作弊)间的区别,或者分辨出哪些是符合内容规范哪些是付费链接,等等。
#11 – 地理位置
一个链接的地理位置高度依赖于这个网站所在的地理位置,不过搜索引擎,尤其是 Google,可能会通过特定的方法来分析大量的数据来精细确认某个网站根域名、子域名或子目录的地理信息。可能包括:
主机的IP地址的位置
顶级域名的后缀中的国家代码(比如.cn, .de, .co, .uk 等)
内容的语言
在本地搜索引擎或地区性网站目录中的注册情况
和具体物理地址(实际地址)相关联
指向网站(或某个栏目)链接的地理位置
从某个指定地区的网站得到外部链接可以帮助网页(或整个网站)在那个地区的搜索中排名更好。同样的,如果你的链接信息显示你强烈倾向于某个地域,那么可能你在其他地方就表现的差点,即使你网站的某些地域信息显示你是现在的地方(比如网站主机的IP地址,域名后缀等)。
#12 – Rel=”Nofollow”的使用
虽然在 SEO 的世界里,nofollow 议题好像已经出现了很久,其实这个用法开始与 2005 年的一月,从 Google 宣布她会支持新的 HTML 标签开始。非常简单,rel=“nofollow”这个标签告诉搜索引擎,这个链接不是我特意推荐和“选出”的,你不用再往前走了,这会提升这个页面本身在搜索引擎查询中独立的排名标准。今天,我们统计了一下,在互联网上大约有 3% 的链接采用了 nofollow,而且,大概有一半的网站在内部使用了 nofollow,远比用在外部链接上的多的多。
在 SEO 圈子里,对不同的搜索引擎是否、如何及怎样严格地遵守这个 nofollow 协议,大家还存在一些疑问。不过一般说来,举例来说,虽然 Wikipedia 的外部链接都采用了 nofollow 标签,但 Google 还是对这些引用外部的链接有些许的排名分数。
#13 -链接类型
链接有很多类型和形式,最大的3类是:
直接使用 HTML 文字链接
图片链接
Javascript 链接
Google 近日宣布他们不仅抓取这些链接,而且还通过他们传递排名评价分数(那些使用 Javascript 进行付费/广告链接的人对这个反复的政策有很多不爽)。多年来,他们已经把图片的 alt 属性中的文字和对待链接中的锚文字那样对待了。
但是,不是所有类型的链接都是被平等对待的。在一些闲暇的测试和样例中显示,直接的含有锚文字的 HTML 链接传递最多的排名价值,接下来就是富含关键字 alt 属性的图片链接,最后就是 javascript 链接(至少在我们的经验中,javascript 链接还是没有被平等地对待和评价的)。链接建设者们,内容审查,小工具创造者和那些有嵌入内容的人应该(我的观点),对于搜索引擎对非标准链接传递的排名价值的能力要有最坏的打算,所以,对链接类型来说,使用标准的保护锚文本的 HTML 链接是最好的优化方法。
#14 – 链接到源页面的其他链接
当页面上的链接链到外面去时,这个页面上的数量和目标也可能被作为评价因素计入传递排名价值中去。
正如我们在 3 中提到的,搜索引擎类似“页面排名”似的算法会把页面上的排名值除以链接数然后再传递出去。再补充一点,搜索引擎可能把链接到外站的数量作为一个判断这些链接的质量和价值的因素。 例如,一个页面只是链接到少数专门内容的外链资源和大量链接指向很多不同外部网站的情况在搜索引擎里可能有不同的认定情况。 不是一定说谁好谁坏坏,但搜索引擎可能会传递对链接认可,有可能来自被其认定为低价值链接来源的链接会被贬值价值。)
搜索引擎也会看链接页面还支持哪些站点。如果一个链接页面链到被认为是 spam 的低质量的页面当然由此获得的价值会比链接到高质量的域名和 URLs 所获得的要少。
#15 – 域名,页面和链接的惩罚
几乎每个 SEO 行业人的都知道,搜索引擎的惩罚会使某个网站丧失传递排名价值的能力。如果一个网站失去这个推荐链接的能力,则从这个网站获得的外链将没有搜索引擎的排名价值。有时搜索引擎会展示出政策性的惩罚结果(不能参与排名,PR 降低等等),但如果一直是惩罚状态则会影响系统获取数据。
#16 -内容/嵌入模式
由于网站内容许可和分发、网站嵌入类小工具、各类积分排名和分布式的嵌入性链接变得越来越流行,搜索引擎已经开始寻找方法以防淹没在这类技术中。我不相信搜索引擎们不想要这种大量的链接来应用于他们的系统,可能他们只是担心过度计入和过度突出某个网站。
最后,我认为内容模式探测和链接模式探测在搜索引擎如何评估链接的多样性和质量中扮演了一个重要的角色。如果搜索引看到,比如,一段有相同链接的文字存在于千百个站点上,那可能并不表示一个级别的推荐。“编辑性”的本质是高度相同的文章片段,在那些明显不同,自动生成的链接可能被打败,但是从搜索引擎的焦点看,如果能够分辨和过滤有这些属性的链接将被证明是对付人为操纵的有效方法。
#17 – 现在的/历史的数据
链接出现的时间和数据是这个列表的最后一项。当搜索引擎爬行网络查看看是否是新网站,新网页和旧的高分链接,他们使用这个数据来和垃圾网站战斗,辨认权威性和相关性甚至传递很好的新鲜信息给网页可以很容易获得很多外链。
搜索引擎如何使用这些吸引链接的模式还在辩论和观察,但是这些数据肯定是被使用、处理和用来帮助排名算法做的更好(并且减少网络上的垃圾链接在排名中的影响 – 尤其是大量的链接购买和滥用)
原文作者:randfish from SEOmoz, 原文链接。本文首发 SEM Watch,转载请注明出处,欢迎大家留言或者来信
搜索引擎是怎样给某个网页排名的,为什么你推荐的这些 SEO 改动会对排名的变动有影响,你在哪儿学的 SEO,你能不能给列一下你做一些比较好的 SEO 案例?当你进的项目进行到一定深度时,就会开始进行链接建设了。客户想知道为什么链接建设那么重要?你就拉出那张“影响网站排名的因素”给他看,指出外链在影响网站搜索引擎排名所占的比重后,他们就会明白了,不过他们又有了另一个问题:
在网页搜索引擎排名上,Google 是怎样决定某个链接带给这个网页多少排名分值呢?
让我们来详细回答一下这个问题。你会发现很多最重要的影响搜索引擎判断一个链接价值的因素和分析。
开始前,有一个很重要的概念需要说说:
可能你注意到了,搜索引擎已经越来越依赖对整个网站的评估多于对某个网页的评估。这就是有时你会看到某些新网页或者只有很少链接的网页排名却很高,仅仅因为它们是在一个重要的、被信任的和外链极好的网站(域名)上。在有关影响搜索引擎排名的因素调查中,我们称之为“网站的权威性”,而且这个因素被 Google 算法(按照投票集合的观点)认为是最重要的。网站(域名)权威性可能基于网站链接图来计算的,而不是基于网页的链接图,下面的列表里,一些标准可能只影响上面其中之一,一些则两个都影响。
#1 – 内部链接 VS 外部链接
当搜索引擎首次通过评价链接到的网页的受欢迎程度、重要性和相关性来判断链接的价值时,它们发现了经典的基于引用的规则——就是指其他人说你好顶过你自卖自夸说千句好要重要,也更可信。因此,内部链接虽然也会带来某些分值和权重,但外部链接带来的要多得多。
当然,这并不意味着好的内部链接架构就不重要了,或者说对内部链接做的一切(有好的锚文本,去掉不需要的链接等等)不重要了,只是说一个网站或某个网页的在排名上的表现高度依赖别的网站怎样引用和评价它们。
#2 – 锚文本
对 SEO 们来说,很明显,锚文本在搜索引擎排名公式中是最重要的因素之一,所以不要奇怪在链接的众多属性中,搜索引擎特别关照这个定位文本的属性。
我们的实验(和以往很多经验)显示,“完全匹配”的定位文本比那些只是被包含着目标关键字的定位文本要来的有益的多。个人观点,搜索引擎不会远离这个标准,尤其对于那些通用(不含品牌的)的关键短语来说,这也是造成很多对 SERPs(搜索结果页面)过于优化和修饰的原因。
#3 – PageRank
无论这个页面排名叫什么,微软叫 StaticRank,Yahoo 叫 WebRank,Google 叫 PageRank,这些都是基于一种递归的、基于马尔可夫链的链接分析算法,是所有搜索引擎排名系统的一部分。PageRank 等排名系统使用的是一种投票的算法,而且和投票网页的影响力和多少有关。
关于 Pagerank 有几点很很重要的基本概念需要知道:
每个网址天生就都被分配了一些数量的 PageRank。
如果一个网页有“n”个链接,每个链接传递出去的页面排名被那个网页的页面排名除于“n”(一个网页上链接越多,那个网页上每个链接传递出去的 PageRank 就越低)
一种通过多次的迭代算法用来计算网络的整个链接图的流向,并以此计算出某个网址的排名分数。
在 Google 的工具条上的 PageRank 数值是指数形式的页面排名,所以页面排名 4 比页面排名 3 要重要 8-10 倍。
页面排名可以通过页面层次的链接图来计算,并给出某个单独的网址 PageRank,但是页面排名也可以通过在网站(域名)级别的链接图来计算,通过计算网站间的链接来决定网站的重要性和排名。
#4 – 信任排名机制
关于信任排名机制的基本概念,请参考斯坦福的论文 – 用信任排名打击网络垃圾。信任排名的基本观点就是互联网上“好的”和“值得信赖”的网页都紧密的链接在一起,然后让垃圾网页只能在这个核心外游荡。因此,通过迭代算法和类似于页面排名的衡量标准让只有来自信任网站的源传递更多的排名权重。信任排名可以用来预报某个网页的质量高低和是否是垃圾网页。
当搜索引擎不披露有关这个衡量标准的相关数据时,有可能某种“距离可信赖信息源距离“的公式应用在页面排名的算法中。另一个有趣的地方是还有一个叫反-信任排名的指标,这个指标用来检测谁链接到那些已知的垃圾站点上,这个可能也是影响排名的一个因素。页面排名和信任排名(以及反-信任排名,reverse-trustrank)都可以在页面层面级别和网站级别来计算排名。
从以上可以直觉地得到一点:从可以信赖的网站得到外链,而且不要链接到垃圾网站。
#5 – 域名权威性
虽然“域名权威性”经常可以在 SEO 界看到(比如域名权威性在影响网站排名的因素中占有很大比重),但是一个正式的、通用的定义却还没有。大多数人都用它来描述搜索引擎根据一个网站的链接数据得来的综合链接广泛度、网站的重要性和可信赖程度。(可能有些搜索引擎还综合一个域名存在的年限因素)
搜索引擎可能通过计算链接并定量地使用评分的方法来确定一个域名(网站)的权威性,而不是只用含糊的言语来描述,所以这是一个值得留意的数据。同时,你从获得外链的域名得到的排名权重可能比单独网页得到的要重要(或重要的多)。
#6 – 外链链接源的多元性
在我们对相关数据的分析后发现,没有哪个因素比来自网站根部的外链对排名的影响大。这显示出这是一个很难控制垃圾网站的指标也显示出外链的重要性和广泛性。
虽然没有因果关系,但很多 SEO 都经验主义地建议你外链网站的多样性对你网站/网页的排名有好处。根据这个逻辑,从一个曾经已经链接到你网站再得到链接比从一个全新的网站得到链接相比,对你的排名提升没有任何价值。这同时说明,从那些本来就多样性的网站得到的链接比那些低多样性网站得到的链接有价值的多。
#7 – 外链来源和目标的唯一性
搜索引擎有自己的一套办法来判定和预测网站间的关系和拥有关系。这包括(但不限于):
大量的共享和反向链接
域名注册数据
共享域名主机 IP 地址或 IP地址的 C 段
公开的收购和关联交易信息
机器可以阅读的公开市场协议
如果搜索引擎判断两个网站间预先存在某种关系,那么可能会对两个网站间链接的“编辑性”质量做抑制处理,它们可能会选择降低分数或干脆忽略这些链接。传闻在这种“网络”中的链接传递很小的价值(尤其是利用经典的“网站范围”建设链接策略形成的链接)。
#8 – 链接在页面上的位置
微软是第一个披露搜索引擎如何处理“区块层级”的(参见微软研究所的文章VIPS : Vision-based Page Segmentation Algorithm基于视觉的网页页面区域算法)。
从那以后,许多 SEO 都报告他们在 Google 和 Yahoo!发现了同样的效果和影响。对于我们也一样,比如,在内部链接中,页脚上的链接不可能提供和页面顶部导航链接一样的效果。还有报告说,为了与不断泛滥的链接广告做斗争,搜索引擎们都降低了从边栏和页脚来的外部链接的分值(价值)。
SEO 们都趋于同意一点:从网页页面“内容”部分来的链接是最有价值的,不管从排名价值来说还是从点击流量来说。(关于页面优化和关键字定位,请参考:网页搜索引擎优化和关键字定位指南)
#9 – 主题相关性
搜索引擎有很多方法对两个网页(网站)进行内容主题分析并判断网页(网站)间是否类似和相关。几年前,Google 实验室推出一项自动分类工具,可以根据 URL(网址)来预测任何虚拟内容的分类和子分类(包括医疗、房地产、市场营销和运动等 10 多个分类)。有可能搜索引擎会使用这种自动主题分类系统来判断网页和链接的“相邻性”,并作为提高网页(网站)排名质量的一项额外措施。
我本身并不担心主题相关性的有关问题,如果你从一个和主题无关的站点( 比NYTimes.com)或一个主题明确的博客得到一个外链,我想这可能对你的排名有好处。我感觉这可能是搜索引擎为了防止垃圾链接或作弊行为说采取的一种分析手段。
#10 – Content & Context Assessment 内容和上下文评估
虽然主题相关性能给搜索引擎提供链接间关系的有用信息,那么可能源链接所在的网页页面内容和上下文更能提供用于决定此链接传给目标网页的价值。在内容和上下文分析里,搜索引擎会通过机器分析/分词来分析和辨析为什么这个链接会存在在这个网页上。
当链接被特意编辑,产生某种模式。链接通过可接受的 HTML 规范、字词用法、措辞等,嵌入到内容中,指向相关的内容来源。通过详细的模式匹配(有可能通过学习大量的数据),搜索引擎可能会分辨出“符合规范的”和“特意编辑”的链接与故意隐藏的(通过作弊)间的区别,或者分辨出哪些是符合内容规范哪些是付费链接,等等。
#11 – 地理位置
一个链接的地理位置高度依赖于这个网站所在的地理位置,不过搜索引擎,尤其是 Google,可能会通过特定的方法来分析大量的数据来精细确认某个网站根域名、子域名或子目录的地理信息。可能包括:
主机的IP地址的位置
顶级域名的后缀中的国家代码(比如.cn, .de, .co, .uk 等)
内容的语言
在本地搜索引擎或地区性网站目录中的注册情况
和具体物理地址(实际地址)相关联
指向网站(或某个栏目)链接的地理位置
从某个指定地区的网站得到外部链接可以帮助网页(或整个网站)在那个地区的搜索中排名更好。同样的,如果你的链接信息显示你强烈倾向于某个地域,那么可能你在其他地方就表现的差点,即使你网站的某些地域信息显示你是现在的地方(比如网站主机的IP地址,域名后缀等)。
#12 – Rel=”Nofollow”的使用
虽然在 SEO 的世界里,nofollow 议题好像已经出现了很久,其实这个用法开始与 2005 年的一月,从 Google 宣布她会支持新的 HTML 标签开始。非常简单,rel=“nofollow”这个标签告诉搜索引擎,这个链接不是我特意推荐和“选出”的,你不用再往前走了,这会提升这个页面本身在搜索引擎查询中独立的排名标准。今天,我们统计了一下,在互联网上大约有 3% 的链接采用了 nofollow,而且,大概有一半的网站在内部使用了 nofollow,远比用在外部链接上的多的多。
在 SEO 圈子里,对不同的搜索引擎是否、如何及怎样严格地遵守这个 nofollow 协议,大家还存在一些疑问。不过一般说来,举例来说,虽然 Wikipedia 的外部链接都采用了 nofollow 标签,但 Google 还是对这些引用外部的链接有些许的排名分数。
#13 -链接类型
链接有很多类型和形式,最大的3类是:
直接使用 HTML 文字链接
图片链接
Javascript 链接
Google 近日宣布他们不仅抓取这些链接,而且还通过他们传递排名评价分数(那些使用 Javascript 进行付费/广告链接的人对这个反复的政策有很多不爽)。多年来,他们已经把图片的 alt 属性中的文字和对待链接中的锚文字那样对待了。
但是,不是所有类型的链接都是被平等对待的。在一些闲暇的测试和样例中显示,直接的含有锚文字的 HTML 链接传递最多的排名价值,接下来就是富含关键字 alt 属性的图片链接,最后就是 javascript 链接(至少在我们的经验中,javascript 链接还是没有被平等地对待和评价的)。链接建设者们,内容审查,小工具创造者和那些有嵌入内容的人应该(我的观点),对于搜索引擎对非标准链接传递的排名价值的能力要有最坏的打算,所以,对链接类型来说,使用标准的保护锚文本的 HTML 链接是最好的优化方法。
#14 – 链接到源页面的其他链接
当页面上的链接链到外面去时,这个页面上的数量和目标也可能被作为评价因素计入传递排名价值中去。
正如我们在 3 中提到的,搜索引擎类似“页面排名”似的算法会把页面上的排名值除以链接数然后再传递出去。再补充一点,搜索引擎可能把链接到外站的数量作为一个判断这些链接的质量和价值的因素。 例如,一个页面只是链接到少数专门内容的外链资源和大量链接指向很多不同外部网站的情况在搜索引擎里可能有不同的认定情况。 不是一定说谁好谁坏坏,但搜索引擎可能会传递对链接认可,有可能来自被其认定为低价值链接来源的链接会被贬值价值。)
搜索引擎也会看链接页面还支持哪些站点。如果一个链接页面链到被认为是 spam 的低质量的页面当然由此获得的价值会比链接到高质量的域名和 URLs 所获得的要少。
#15 – 域名,页面和链接的惩罚
几乎每个 SEO 行业人的都知道,搜索引擎的惩罚会使某个网站丧失传递排名价值的能力。如果一个网站失去这个推荐链接的能力,则从这个网站获得的外链将没有搜索引擎的排名价值。有时搜索引擎会展示出政策性的惩罚结果(不能参与排名,PR 降低等等),但如果一直是惩罚状态则会影响系统获取数据。
#16 -内容/嵌入模式
由于网站内容许可和分发、网站嵌入类小工具、各类积分排名和分布式的嵌入性链接变得越来越流行,搜索引擎已经开始寻找方法以防淹没在这类技术中。我不相信搜索引擎们不想要这种大量的链接来应用于他们的系统,可能他们只是担心过度计入和过度突出某个网站。
最后,我认为内容模式探测和链接模式探测在搜索引擎如何评估链接的多样性和质量中扮演了一个重要的角色。如果搜索引看到,比如,一段有相同链接的文字存在于千百个站点上,那可能并不表示一个级别的推荐。“编辑性”的本质是高度相同的文章片段,在那些明显不同,自动生成的链接可能被打败,但是从搜索引擎的焦点看,如果能够分辨和过滤有这些属性的链接将被证明是对付人为操纵的有效方法。
#17 – 现在的/历史的数据
链接出现的时间和数据是这个列表的最后一项。当搜索引擎爬行网络查看看是否是新网站,新网页和旧的高分链接,他们使用这个数据来和垃圾网站战斗,辨认权威性和相关性甚至传递很好的新鲜信息给网页可以很容易获得很多外链。
搜索引擎如何使用这些吸引链接的模式还在辩论和观察,但是这些数据肯定是被使用、处理和用来帮助排名算法做的更好(并且减少网络上的垃圾链接在排名中的影响 – 尤其是大量的链接购买和滥用)
原文作者:randfish from SEOmoz, 原文链接。本文首发 SEM Watch,转载请注明出处,欢迎大家留言或者来信
百度官方解释:http返回状态码的含义
百度爬虫在进行抓取和处理时,是根据http协议规范来设置相应的逻辑的,所以请站长们也尽量参考http协议中关于返回码的含义的定义来进行设置。
百度spider对常用的http返回码的处理逻辑是这样的:
1、404(404页面该怎么做?)
404返回码的含义是“NOT FOUND”,百度会认为网页已经失效,那么通常会从搜索结果中删除,并且短期内spider再次发现这条url也不会抓取。
2、503
503返回码的含义是“Service Unavailable”,百度会认为该网页临时不可访问,通常网站临时关闭,带宽有限等会产生这种情况。对于网页返回503,百度spider不会把这条url直接删除,短期内会再访问。届时如果网页已恢复,则正常抓取;如果继续返回503,短期内还会反复访问几次。但是如果网页长期返回503,那么这个url仍会被百度认为是失效链接,从搜索结果中删除。
3、403
403返回码的含义是“Forbidden”,百度会认为网页当前禁止访问。对于这种情况,如果是新发现的url,百度spider暂不会抓取,短期内会再次检查;如果是百度已收录url,当前也不会直接删除,短期内同样会再访问。届时如果网页允许访问,则正常抓取;如果仍不允许访问,短期内还会反复访问几次。但是如果网页长期返回403,百度也会认为是失效链接,从搜索结果中删除。
4、301 (301重定向)
301返回码的含义是“Moved Permanently”,百度会认为网页当前跳转至新url。当遇到站点迁移,域名更换、站点改版的情况时,推荐使用301返回码,尽量减少改版带来的流量损失。虽然百度spider现在对301跳转的响应周期较长,但我们还是推荐大家这么做。
我们的建议
1、如果站点临时关闭,当网页不能打开时,不要立即返回404,建议使用503状态。503可以告知百度spider该页面临时不可访问,请过段时间再重试。
2、如果百度spider对您的站点抓取压力过大,请尽量不要使用404,同样建议返回503。这样百度spider会过段时间再来尝试抓取这个链接,如果那个时间站点空闲,那它就会被成功抓取了。
3、有一些网站希望百度只收录部分内容,例如审核后的内容,累积一段时间的新用户页等等。在这种情况,建议新发内容暂时返回403,等审核或做好处理之后,再返回正常状态的返回码。
4、站点迁移,或域名更换时,请使用301返回码。
百度爬虫在进行抓取和处理时,是根据http协议规范来设置相应的逻辑的,所以请站长们也尽量参考http协议中关于返回码的含义的定义来进行设置。
百度spider对常用的http返回码的处理逻辑是这样的:
1、404(404页面该怎么做?)
404返回码的含义是“NOT FOUND”,百度会认为网页已经失效,那么通常会从搜索结果中删除,并且短期内spider再次发现这条url也不会抓取。
2、503
503返回码的含义是“Service Unavailable”,百度会认为该网页临时不可访问,通常网站临时关闭,带宽有限等会产生这种情况。对于网页返回503,百度spider不会把这条url直接删除,短期内会再访问。届时如果网页已恢复,则正常抓取;如果继续返回503,短期内还会反复访问几次。但是如果网页长期返回503,那么这个url仍会被百度认为是失效链接,从搜索结果中删除。
3、403
403返回码的含义是“Forbidden”,百度会认为网页当前禁止访问。对于这种情况,如果是新发现的url,百度spider暂不会抓取,短期内会再次检查;如果是百度已收录url,当前也不会直接删除,短期内同样会再访问。届时如果网页允许访问,则正常抓取;如果仍不允许访问,短期内还会反复访问几次。但是如果网页长期返回403,百度也会认为是失效链接,从搜索结果中删除。
4、301 (301重定向)
301返回码的含义是“Moved Permanently”,百度会认为网页当前跳转至新url。当遇到站点迁移,域名更换、站点改版的情况时,推荐使用301返回码,尽量减少改版带来的流量损失。虽然百度spider现在对301跳转的响应周期较长,但我们还是推荐大家这么做。
我们的建议
1、如果站点临时关闭,当网页不能打开时,不要立即返回404,建议使用503状态。503可以告知百度spider该页面临时不可访问,请过段时间再重试。
2、如果百度spider对您的站点抓取压力过大,请尽量不要使用404,同样建议返回503。这样百度spider会过段时间再来尝试抓取这个链接,如果那个时间站点空闲,那它就会被成功抓取了。
3、有一些网站希望百度只收录部分内容,例如审核后的内容,累积一段时间的新用户页等等。在这种情况,建议新发内容暂时返回403,等审核或做好处理之后,再返回正常状态的返回码。
4、站点迁移,或域名更换时,请使用301返回码。
日历对SEO有何影响(视频)
如果不知道日历的影响,可以先了解一下这篇文章(URL过长为什么不利于抓取和优化),你的网站上是否有一个日历表,上面的链接指向无数个过去和将来的日期(每一个链接地址都独一无二)?你的网页地址是否在加入一个&page=3563的参数之后,仍然可以返回200代码,哪怕根本没有这么多页?如果是这样的话,你的网站上就出现了所谓的“无限空间”,这种情况会浪费抓取机器人和你的网站的带宽。如何控制好“无限空间”,参考这里的一些技巧吧。
下图是以zblog为例,删除zblog中的日历

日历对SEO有何影响(视频)
如果不知道日历的影响,可以先了解一下这篇文章(URL过长为什么不利于抓取和优化),你的网站上是否有一个日历表,上面的链接指向无数个过去和将来的日期(每一个链接地址都独一无二)?你的网页地址是否在加入一个&page=3563的参数之后,仍然可以返回200代码,哪怕根本没有这么多页?如果是这样的话,你的网站上就出现了所谓的“无限空间”,这种情况会浪费抓取机器人和你的网站的带宽。如何控制好“无限空间”,参考这里的一些技巧吧。
下图是以zblog为例,删除zblog中的日历
日历对SEO有何影响(视频)