刚才提到百度搜索引擎会设计复杂的抓取策略,其实搜索引擎与资源提供者之间存在相互依赖的关系,其中搜索引擎需要站长为其提供资源,否则搜索引擎就无法满足用户检索需求;而站长需要通过搜索引擎将自己的 内容推广出去获取更多的受众。spider抓取系统直接涉及互联网资源提供者的利益,为了使搜素引擎与站长能够达到双赢,在抓取过程中双方必须遵守一定的 规范,以便于双方的数据处理及对接。这种过程中遵守的规范也就是日常中我们所说的一些网络协议。

以下简单列举:
        http协议:超文本传输协议,是互联网上应用最为广泛的一种网络协议,客户端和服务器端请求和应答的标准。客户端一般情况是指终端用户,服务器端即指网 站。终端用户通过浏览器、蜘蛛等向服务器指定端口发送http请求。发送http请求会返回对应的httpheader信息,可以看到包括是否成功、服务 器类型、网页最近更新时间等内容。

https协议:实际是加密版http,一种更加安全的数据传输协议。

UA属性:UA即user-agent,是http协议中的一个属性,代表了终端的身份,向服务器端表明我是谁来干嘛,进而服务器端可以根据不同的身份来做出不同的反馈结果。

robots协议:robots.txt是搜索引擎访问一个网站时要访问的第一个文件,用以来确定哪些是被允许抓取的哪些是被禁止抓取的。 robots.txt必须放在网站根目录下,且文件名要小写。详细的robots.txt写法可参考 http://www.robotstxt.org 。百度严格按照robots协议执行,另外,同样支持网页内容中添加的名为robots的meta标 签,index、follow、nofollow等指令。

相关文章:
哪些网页无法建入索引库
百度优先建重要库的原则
新链接重要程度判断
造成Baiduspider抓取异常的原因
Baiduspider抓取频次原则及调整方法
Baiduspider抓取过程中涉及的网络协议
Baiduspider 主要抓取策略类型
Spider抓取系统的基本框架
Baiduspider 主要抓取策略类型

上图看似简单,但其实Baiduspider在抓取过程中面对的是一个超级复杂的网络环境,为了使系统可以抓取到尽可能多的有价值资源并保持系统及实际环境中页面的一致性同时不给网站体验造成压力,会设计多种复杂的抓取策略。以下做简单介绍:

1、抓取友好性
        互联网资源庞大的数量级,这就要求抓取系统尽可能的高效利用带宽,在有限的硬件和带宽资源下尽可能多的抓取到有价值资源。这就造成了另一个问题,耗费被抓网站的带宽造成访问压力,如果程度过大将直接影响被抓网站的正常用户访问行为。因此,在抓取过程中就要进行一定的抓取压力控制,达到既不影响网站的正常用户访问又能尽量多的抓取到有价值资源的目的。

通常情况下,最基本的是基于ip的压力控制。这是因为如果基于域名,可能存在一个域名对多个ip(很多大网站)或多个域名对应同一个ip(小网站共享ip)的问题。实际中,往往根据ip及域名的多种条件进行压力调配控制。同时,站长平台也推出了压力反馈工具,站长可以人工调配对自己网站的抓取压力,这时百度spider将优先按照站长的要求进行抓取压力控制。

对同一个站点的抓取速度控制一般分为两类:其一,一段时间内的抓取频率;其二,一段时间内的抓取流量。同一站点不同的时间抓取速度也会不同,例如夜深人静月黑风高时候抓取的可能就会快一些,也视具体站点类型而定,主要思想是错开正常用户访问高峰,不断的调整。对于不同站点,也需要不同的抓取速度。


2、常用抓取返回码示意
        简单介绍几种百度支持的返回码:
        1)最常见的404代表“NOT FOUND”,认为网页已经失效,通常将在库中删除,同时短期内如果spider再次发现这条url也不会抓取;
        2)503代表“Service Unavailable”,认为网页临时不可访问,通常网站临时关闭,带宽有限等会产生这种情况。对于网页返回503状态码,百度spider不会把这条url直接删除,同时短期内将会反复访问几次,如果网页已恢复,则正常抓取;如果继续返回503,那么这条url仍会被认为是失效链接,从库中删除。
        3)403代表“Forbidden”,认为网页目前禁止访问。如果是新url,spider暂时不抓取,短期内同样会反复访问几次;如果是已收录url,不会直接删除,短期内同样反复访问几次。如果网页正常访问,则正常抓取;如果仍然禁止访问,那么这条url也会被认为是失效链接,从库中删除。
        4)301代表是“Moved Permanently”,认为网页重定向至新url。当遇到站点迁移、域名更换、站点改版的情况时,我们推荐使用301返回码,同时使用站长平台网站改版工具,以减少改版对网站流量造成的损失。



3、多种url重定向的识别
        互联网中一部分网页因为各种各样的原因存在url重定向状态,为了对这部分资源正常抓取,就要求spider对url重定向进行识别判断,同时防止作弊行为。重定向可分为三类:http 30x重定向、meta refresh重定向和js重定向。另外,百度也支持Canonical标签,在效果上可以认为也是一种间接的重定向。

4、抓取优先级调配
        由于互联网资源规模的巨大以及迅速的变化,对于搜索引擎来说全部抓取到并合理的更新保持一致性几乎是不可能的事情,因此这就要求抓取系统设计一套合理的抓取优先级调配策略。主要包括:深度优先遍历策略、宽度优先遍历策略、pr优先策略、反链策略、社会化分享指导策略等等。每个策略各有优劣,在实际情况中往往是多种策略结合使用以达到最优的抓取效果。



5、重复url的过滤
        spider在抓取过程中需要判断一个页面是否已经抓取过了,如果还没有抓取再进行抓取网页的行为并放在已抓取网址集合中。判断是否已经抓取其中涉及到最核心的是快速查找并对比,同时涉及到url归一化识别,例如一个url中包含大量无效参数而实际是同一个页面,这将视为同一个url来对待。



6、暗网数据的获取
        互联网中存在着大量的搜索引擎暂时无法抓取到的数据,被称为暗网数据。一方面,很多网站的大量数据是存在于网络数据库中,spider难以采用抓取网页的方式获得完整内容;另一方面,由于网络环境、网站本身不符合规范、孤岛等等问题,也会造成搜索引擎无法抓取。目前来说,对于暗网数据的获取主要思路仍然是通过开放平台采用数据提交的方式来解决,例如“百度站长平台”“百度开放平台”等等。

7、抓取反作弊
        spider在抓取过程中往往会遇到所谓抓取黑洞或者面临大量低质量页面的困扰,这就要求抓取系统中同样需要设计一套完善的抓取反作弊系统。例如分析url特征、分析页面大小及内容、分析站点规模对应抓取规模等等。

相关文章:
哪些网页无法建入索引库
百度优先建重要库的原则
新链接重要程度判断
造成Baiduspider抓取异常的原因
Baiduspider抓取频次原则及调整方法
Baiduspider抓取过程中涉及的网络协议
Baiduspider 主要抓取策略类型
Spider抓取系统的基本框架

Spider抓取系统的基本框架 不指定

元创 , 2014/12/19 09:50 , 百度动态 , 评论(0) , 阅读(3217) , Via 本站原创
Spider抓取系统的基本框架

互联网信息爆发式增长,如何有效的获取并利用这些信息是搜索引擎工作中的首要环节。数据抓取系统作为整个搜索系统中的上游,主要负责互联网信息的搜集、保存、更新环节,它像蜘蛛一样在网络间爬来爬去,因此通常会被叫做“spider”。例如我们常用的几家通用搜索引擎蜘蛛被称为:Baiduspdier、Googlebot、Sogou Web Spider等。

Spider抓取系统是搜索引擎数据来源的重要保证,如果把web理解为一个有向图,那么spider的工作过程可以认为是对这个有向图的遍历。从一些重要的种子 URL开始,通过页面上的超链接关系,不断的发现新URL并抓取,尽最大可能抓取到更多的有价值网页。对于类似百度这样的大型spider系统,因为每时 每刻都存在网页被修改、删除或出现新的超链接的可能,因此,还要对spider过去抓取过的页面保持更新,维护一个URL库和页面库。

下图为spider抓取系统的基本框架图,其中包括链接存储系统、链接选取系统、dns解析服务系统、抓取调度系统、网页分析系统、链接提取系统、链接分析系统、网页存储系统。Baiduspider即是通过这种系统的通力合作完成对互联网页面的抓取工作。

点击在新窗口中浏览此图片

相关文章:
哪些网页无法建入索引库
百度优先建重要库的原则
新链接重要程度判断
造成Baiduspider抓取异常的原因
Baiduspider抓取频次原则及调整方法
Baiduspider抓取过程中涉及的网络协议
Baiduspider 主要抓取策略类型
Spider抓取系统的基本框架
    转自腾讯网:专访元创:掌握营销之道 全方位推广成趋势

   在现如今的经济环境下,成功的线上推广对于企业来说直接影响着效益的好坏。所以有远见的管理者都会在这方面投入精力。然而,高效的推广除了取决于投入资金的多少以外,更在于讲究方式方法。比如在传统互联网领域,适当的SEO可以让企业网站的流量增加,从而降低直接投放的资金压力,在移动互联网领域,新兴的微信推广在效果和用户影响力方面又要胜过自主开发APP。日前,记者特地走访了资深SEO专家元创先生,请他就现代企业网络推广及新媒体营销等方面的问题,阐述了自己的观点。
点击在新窗口中浏览此图片
图:推一把联合创始人、资深SEO实战专家元创

    据了解,国内知名SEO实战家、互联网营销专家元创先生作为推一把联合创始人,拥有7年互联网营销实战经验,为超过1000家企业提供互联网营销服务,帮助上百家中小企业建设互联网营销运营体系,构建互联网营销系统。独创《搜索引擎营销七步成名法》、《企业免费网络营销资源最大化》,CETTIC人保部网络营销师考试标准制定者之一,曾为奥迪、AMD、沃尔沃等世界500强企业提供网络营销服务。

全方位推广已成新趋势

    随着移动互联网进入普及时代,入口和用户的价值日益凸显。在这种情况下,原有单纯依靠SEO的推广方式已经日渐吃力,而全方位的推广体系,由于可以获得更好的效果,日益受到企业的欢迎。

    元创先生表示,和前几年相比,近些年来网络推广的趋势变化主要有三点,第一、竞争加剧:越来越多的企业已经非常重视网络营销,但都在同一个阵地抢用户,随之而来的是竞争越来越激烈。第二、全网营销:从刚开始方法单一,只会SEO,到现在全网营销,所有推广方法都要做。但需要注意的是,很多企业在推广时只是发广告,不能突出产品优势。第三、从兼到专:从刚开始兼职人员负责SEO,竞价,网络推广,到现在每个公司必须有专业的人才、团队,或是增加了经过专业培训的人员。总之,一句话,网络推广方式已经从过去简单、粗暴的方式,逐渐演变到现在的流程化、精细化。

企业网站SEO需平衡兼顾

    在目前的网络推广中,最起初的应该就是SEO了,但实际上,这看似简单的环节却也蕴含着很大的学问。元创先生认为,企业网站SEO容易开展,大部分企业产品比较少,把握好几个关键产品,能够分析用户搜索需求,这是最关键的。很多做SEO的从业者,对公司哪个产品最重要还没搞清楚,就开始优化,即使花再大的精力和时间,优化结果还是达不到要求,所以,关键词的选择是最关键的,然后就是用户通过搜索关键词进入到网站后,网站是否是围绕这些产品开展的,是否能满足用户的搜索需求,也就是你的内容质量如何,是不是用户搜索进来想要的。

    除此之外,外部链接推荐也相当重要,别人说你的网站好,才算好,你的内容就是你的产品,外部链接就是你的评价。最后就是加强关键词的研究,内容,外链,这三块占的比重大,这三块做好了,其他细节再进行优化,那就能够事半功倍。

顺势而为是新媒体推广基础

    和传统媒体相比,包括微信,微博等新媒体在营销方面更具效率和可信性。所以很多企业为了加强效果,往往采用了传统媒体加新媒体的组合推广方式。不过,新媒体的推广和传统媒体地毯轰炸的方式不同,需要更多的技巧。
我是元创,上篇文章元创提到《如何做好微信公众账号栏目策划》和今天分享的内容运营是紧密相连的。做营销,想要获得好的效果,内容是根本。传统营销,例如报纸广告,文案写的不好,效果会很差;做网络营销,即使精通各种营销手段,但是内容不能抓住用户需求点,不能给用户带来价值,不能突出产品卖点,效果也会有折扣;在SEO中,有一句话是,内容为王,外链为皇,足以说明内容的重要性,那么对于移动互联网营销来说,微信目前是一把营销利剑,企业通过微信公众账号引粉丝、造品牌、铺销量。但微信公众账号是被动关注,用户对你的账号感兴趣,才会主动关注你,类似邮件订阅一样,怎么才能让用户主动关注你的账号呢,为用户提供有价值的内容是关键。

但做内容谈何容易呀,元创也有订阅号,也订阅了很多公众账号,现在发现一个非常明显的现象,很多公众账号推送内容频率明显减少,为什么呢?要么是没有运营人员,要么是没有内容可发。想要做好微信公众账号的运营,需要专门一个人来维护,先不说原创内容了,每天找优质的内容至少得1-2个小时,这只是简单维护运营,如果要做个活动,那就不止需要一个内容运营人员了,还需要策划人员。

很多企业虽然很重视微信营销,也增设了微信运营职务,但都想快速通过微信公众账号销售产品,把微信公众账号当作发广告的工具,这样就失去了微信营销的本质目的。

很多人会问了,元创,你说了这么久了,到底微信内容如何运营啊

我刚开始在运营公众账号时,也尝试过很多内容,行业资讯、牛人分享、各类访谈,但通过微信后台数据发现打开率并不高(除了考虑自身推广力度外)。我就转变思路,先分析用户,分析目标用户,了解用户的需求点,然后解决需求。

我就分析我的朋友圈大家都乐意分享什么信息,分享正能量、最新资讯、实用信息,案例等类的居多,自从微信公众账号可以查看阅读量以后,就更方便了,直接打开看看这些文章的阅读量,高的肯定是用户喜欢的,并乐意分享的。比如前一段时间阿里巴巴有一个视频《阿里巴巴纪录片:扬子江中的大鳄》,马云老婆的励志文章,世界互联网大会嘉宾演讲信息、PPT等这些信息被各大公众账号转发,阅读量都非常高,说明什么,别人发了,是他的用户群体看到了,但不一定我们的用户群体都看到,我们是否也可以转发呢?这样的文章,用户喜欢看,也最容易分享到自己的朋友圈,引起更多的分享,这就是用户想要的。我不是说让大家疯狂的转载别人的内容,我们要分析哪些内容是用户喜欢的,针对我们用户群体去找文章或原创文章。

那具体,微信公众账号发什么内容呢,元创给大家分享几个技巧
1、每天观察朋友们分享的内容,是否会吸引你,如果吸引你,再观察阅读量,可以整理成为自己的素材。
2、多关注热点,分享热点,比如前一段时间的世界互联网大会,冬天护肤,雾霾等信息,备受关注。
3、多收集热门案例,特别是最新的成功案例,PPT,视频等,不要把老掉牙的案例拿出来分享
4、团队管理、好书推荐还是有必要的

每个行业每个账号需要根据用户定内容,但吃喝玩乐、学习、健康、工作这些是大众化需求,人人都需要的。

微信内容运营除了内容之外,还需要做好很多细节,比如如何引导用户分享,如何吸引人关注公众账号,如何让用户持续关注,这些都是需要每个运营人员做的,元创的下一篇文章会分享《如何引导用户关注的几个关键点》,敬请关注。

PS:这是一篇元创写的文章!

扫一扫右侧二维码,关注“元创”回复“百度”   免费领取:
《百度站长平台高级工程师-高波 分享的《链接人与信息》》
《百度站长平台高端沙龙徐州站ppt分享《百度流量异常排查方法》》
关注“元创”回复“PPT”   免费领取:
《2014乌镇世界互联网大会PPT》
2014乌镇世界互联网大会PPT下载

   2014年11月19日至21日,首届世界互联网大会将在浙江乌镇举行。这是中国举办的规模最大、层次最高的互联网大会,也是世界互联网领域一次盛况空前的高峰会议。大会以“互联互通 共享共治”为主题,由国家互联网信息办公室和浙江省人民政府共同主办,由浙江省网信办、浙江省经信委、桐乡市政府和中国互联网络信息中心联合承办。

2014年11月18日,首届世界互联网大会新闻发言人、国家互联网信息办公室新闻信息传播局局长姜军表示,世界互联网大会将永久落户乌镇,每年一届,持续举办。
点击在新窗口中浏览此图片
互联网的出现让地球变成一个村庄,从东方到西方,只需一个视频,我们就可以彼此谈国事、聊情感。今天,世界互联网大会在散发着古老文明气息的中国再次走在了世界前列。2014乌镇世界互联网大会PPT资料下载

由国家网信办和浙江省人民政府主办的首届世界互联网大会,是中国举办的规模最大、层次最高的互联网大会,也是世界互联网领域的一场高峰。

获取方式:扫一扫右侧底部元创微信公众账号,关注“元创”,回复“PPT”,即可下载!
百度认为什么样的网站更有抓取和收录价值呢?我们从下面几个方面简单介绍.鉴于技术保密以及网站运营的差异等其他原因,以下内容仅供站长参考,具体的收录策略包括但不仅限于所述内容。

第一方面:网站创造高品质的内容,能为用户提供独特的价值。

百度作为搜索引擎,最终的目的是满足用户的搜索需求,所以要求网站内容首先能满足用户的需求,现今互联网上充斥了大量同质的内容,在同样能满足用户需求的前提下,如果您网站提供的内容是独一无二的或者是具有一定独特价值的,那么百度会更希望收录您的网站。

温馨提示:百度希望收录这样的网站:

网站能满足一定用户的需求

网站信息丰富,网页文字能清晰、准确地表述要传达的内容。

有一定原创性或独特价值。

相反的,很多网站内容是“一般或低质”的,甚至某些网站利用欺骗手段来获取更好的收录或排名,下面列举一些常见的情况,虽然无法对各种情况一一列举。但请不要抱有侥幸心理,百度有完善的技术支持发现并处理这些行为。

请不要为搜索引擎创造内容。

某些网站在设计时不是从用户角度出发考虑的,而是为了从搜索引擎骗取更多的流量。比如提交给搜索引擎一种内容而显示给用户另一种。这些行为包括但不仅限于:在网页中加入隐藏文字或隐藏链接;在网页中加入与网页内容不相关的关键词;具有欺骗性跳转或重定向;专门针对搜索引擎制作桥页;针对搜索引擎利用程序生成的内容。

请不要创建多个包含大量重复内容的网页、子域或域。

百度会尽量收录提供不同信息的网页,如果您的网站包含了大量重复的内容,那么搜索引擎会减少相同内容的收录,同时认为该网站提供的内容价值偏低。

当然如果网站上相同的内容是通过不同形式展现(如论坛的简版页面、打印页),可以使用robots.txt禁止spider抓取网站不想向用户展现的形式,这也有助于节省带宽。

请不要制作欺诈性或安装有病毒、特洛伊木马或其他有害软件的网页。

谨慎加入频道共建、内容联盟等不能产生或很少产生原创内容的计划,除非网站能为内容联盟创造原创的内容。

第二方面:网站提供的内容得到了用户、站长的认可和支持

一个网站上的内容如果得到了用户和站长的认可,那么对百度来说也是非常值得收录的。百度会通过分析真实用户的搜索行为、访问行为、网站之间的关系等综合给一个网站的认可度的评价。但是值得说明的是,这种认可必须是建立在网站为用户提供了优质内容的基础上,是真实、有效的。下面仅以网站之间的关系为例,来说明百度是如何看待其他站长对您网站的认可的:通常网站之间的链接可帮助百度的抓取工具找到您的网站,并提高您的网站的认可度。百度将从网页A至网页B的链接解释为网页A向网页B的投票。通过网页投票表决可以体现网页本身的“认可度”更具分量,并且有助于提高其他网页的“认可度”。链接的数量、质量以及相关性都会影响到“认可度”的计算。

但请注意,不是所有的链接都能参与认可度的计算,只有那些自然的链接才是有效的。(自然链接是指当其他网站发现您的内容具有价值并认为其可能对访问者有所帮助时,在网络的动态生成过程中形成的。)

要使其他网站创建与您网站相关的链接,最好的方式是创建可在互联网内赢得人气的独特且相关的内容。您的内容越实用,其他站长越容易发现您的内容对其用户有价值,因而也就越容易链接到您的网站。在做出是否要增加链接的决定之前,您应当先考虑:这样做对我网站的访问者是否真的有益?

然而,某些网站站长时常不顾链接质量和链接来源而进行链接交换,并单纯地为了认可度而人为的建立链接关系,这些都会对其网站产生长期影响。

温馨提示:会对网站产生不良影响的链接包括但不仅限于:

企图操纵“认可度”计算的链接

指向网络中违禁网站、垃圾站点或恶性链接的链接

互惠链接或链接交换(如“链接到我,我也会链接到您”)过多

购买或销售用于提升网站“认可度”的链接

第三方面: 网站有良好的浏览体验

一个网站有良好的浏览体验,那么对用户来说是非常有益的,百度也会认为这样的网站是有更好的收录价值的。良好的浏览体验是指:

网站具有清晰的层次结构。

为用户提供包含指向网站重要部分的链接的站点地图和导航。使用户能够清晰、简单的浏览网站,快速的找到其所要的信息。

网站有良好的性能:包括浏览速度和兼容性。

网站速度快可以提高用户满意度,还可改善网页的整体质量(尤其对于互联网连接速度慢的用户)。

确保网站的内容在不同的浏览器中均能正确显示,防止某些用户不能正常访问。

网站的广告不干扰用户的正常访问。

广告是网站的重要收入来源,网站包含广告是非常合理的现象,但是如果广告过多会影响了用户的浏览;或者网站有太多不相关的弹窗、飘窗广告都可能会使用户反感。

百度的目标是向用户提供相关度最高的搜索结果以及最佳用户体验,如果广告对用户体验造成伤害,那么这样的站点是百度抓取时需要减少的。

合理设置网站的权限。

网站的注册访问等权限可以增加网站的注册用户、保证网站的内容质量,但过多的权限设置可能会使新用户失去耐性,给用户带来不好的体验。从百度来说希望减少提供对用户来说信息获取成本太高的网页。
      在与大中型网站SEO人员沟通的过程中常听到这样的报怨:SEO地位低,净收拾产品技术编辑的烂摊子了。起初我们感觉非常不可思议,但后来发现这种情况还非常普遍。相应的,对于那些可以从搜索引擎获得大批流量的站点来说,SEO思维渗透到了每个岗位,产品人员在提交项目MRD时,网页标题的写法是必不可少的一部分;编辑对文章内容负责的同时,要设计出吸引用户和搜索引擎的标题;而不是单纯地把优化工作全部扔给SEO人员。所以,今天我们想跟产品人员和编辑说说网页标题该怎么写。

一,标题的结构
1,标题字数控制在60个字节内
从以往的经验看,检索用户比较喜欢50个字节左右的标题;对于产品人员和编辑来说,过短的标题有可能无法全面表达网页主题;对于搜索引擎来说,标题过长意味着“超标”,只会保留前60个字节的内容。
反面case:福州到北京旅游_北京旅游天气如何_北京旅游景点介绍_北京好玩吗_现在去北京旅游会热吗

2,重要内容放在标题的最前面
在众多检索结果中,用户的目光往往聚焦在标题前半段,所以重要信息内容放在标题前部非常重要。
正面case:关之琳否认脑癌发作 称洗牙遭误会|关之琳|癌症_凤凰娱乐

3,放置网站名称,增加曝光机会有些站点已经在某领域有了一定的知名度和权威性,其站名名称已经成为一种品牌,可以将该品牌词体现在标题中,用户在面对众多结果时,更倾向于选择点击自己熟知网站提供的信息。即使网站目前的知名度还不够,更不应该放过每个品牌曝光的机会。
正面case:【单电和微单的区别】-蜂鸟网
正面case:法国卢浮宫博物馆藏文物精品在中国国家博物馆展出-新华网

二,标题放什么内容更吸引用户
用户在百度搜索框输入关键词后,百度在对相关网页进行排序时,网页标题内容是其考虑的重要因素。同时,搜索结果页内通常会有10个结果,用户往往是通过标题和摘要来决定要点击开哪个结果。标题上关键词的选择至关重要。

1,与网页内容最相关的关键词
首先,标题应该和网页内容相对应,即标题上的内容,可以在网页主体部分得到展示。一般来说,如果网页主要部分是一篇文章,网页标题的主要内容往往是文章标题;如果网页是一个综合信息的集合页,我们也要找到这些信息的共同点,通过一两个关键词将其表现在网页标题上。正面case: 婴儿哭闹的原因_婴儿期0-1岁_育儿知识_宝宝树

2,选择用户更常用的关键词
同一个物品有不同的名称、同一件事情也有不同的描述,选择哪个放在title上呢?虽然百度有强大的关键词分析算法,但我们还是推荐大家使用搜索引擎用户最常用的那个。关键词的热度可以通过百度指数进行查询,目前网络上还有一些其它工具,大家也可以参考一下。

如佳能有一款单反相机,标准全称是“5d mark ii”,简称“5D2”,广大搜索爱好者亲切地称之为“无敌兔”。从字面上看,“5d mark ii”输入起来比较麻烦。再看一下它们的百度指数:
“5d mark ii”:257
“5D2”:875
“无敌兔”:467
很明显,“5D2”由于指向清晰、朗朗上口且容易输入,最受搜索引擎用户喜爱

3,选择能满足用户明确需求的关键词
能体现用户明确需求的关键词往往字数偏长,SEO人员一般称此为长尾关键词,如“杭州两日游路线”“从上海到西塘怎么走”等。我们的产品人员和编辑应该一方面了解用户需求,一方面制作可以满足用户需求的网页,通过将含有用户明确需求的关键词写在标题上来吸引搜索引擎用户的点击。
正面case: 【宝宝补锌】儿童缺锌怎么办_怎样给孩子补锌-摇篮网

4,在真实的前提下体现时效性
在标题放时效性关键词最重要的前提是:网页里真的有时效性内容,否则非常容易被搜索引擎惩罚。
正面case:2014-10月8万套北京北京二手房价格,真房价没水分!「链家」

5,直击用户痛点,引发共鸣
还以上面那个case为例,虚假房源和房价一直是二手房买方心中的痛,“2014-10月8万套北京北京二手房价格,真房价没水分!「链家」”直面用户痛点,再配上“链家”的招牌,点击率一直居高不下。当然,这已经超越了SEO的范畴,相信编辑人员在这方面有更多经验。

三,设计标题时避免做下面的事情
1,欺骗用户和搜索引擎
有些网站在标题上放置过多重复意义的关键词,甚至放置与内容无关的热门关键词以吸引甚至欺骗用户和搜索引擎,这样很容易被搜索引擎判为作弊而受到惩罚,是一件非常危险的事情。所以:千万不要在标题中体现网页内没有的内容。
反面case1:青蛇完整_青蛇完整全集在线观看_青蛇完整完整版视频——该网页仅仅提供了片花视频
反面case2:李小璐不雅视频引撞脸门 2万抵3万拒绝“撞楼”——该网页主要介绍的是楼盘信息

2,避免多网页使用同一个标题
原则上每个网页都应该有自己独特的标题,如果整个网站的标题全部一致,将失去向搜索引擎表达含义的重要机会。
分页: 7/130 第一页 上页 2 3 4 5 6 7 8 9 10 11 下页 最后页 [ 显示模式: 摘要 | 列表 ]