<?xml version="1.0" encoding="UTF-8" ?>
<rss version="2.0">
<channel>
<title><![CDATA[北京SEO_北京SEO培训 - 【元创SEO】]]></title> 
<link>http://www.yuan-chuang.cc/index.php</link> 
<description><![CDATA[元创拥有10多年网络营销和SEO实战经验、管理经验。 《SEO实战 - 核心技术、优化策略、流量提升》一书作者。SEO实战家、推一把联合创始人]]></description> 
<language>zh-cn</language> 
<copyright><![CDATA[北京SEO_北京SEO培训 - 【元创SEO】]]></copyright>
<item>
<link>http://www.yuan-chuang.cc/read.php/.htm</link>
<title><![CDATA[页面长度过长，也会导致不收录？]]></title> 
<author>元创 &lt;&gt;</author>
<category><![CDATA[SEO知识库]]></category>
<pubDate>Sat, 17 Jun 2017 00:48:54 +0000</pubDate> 
<guid>http://www.yuan-chuang.cc/read.php/.htm</guid> 
<description>
<![CDATA[ 
	<strong>页面长度过长，也会导致不收录？</strong><br/><br/><strong>站点反馈：</strong><br/><br/>网站主体内容都是js生成，针对用户访问，没有做优化；但是网站特针对爬虫抓取做了优化，且将图片也直接做了base64转化；然而优化后发现内容却不被百度收录<br/><br/>页面质量很好，还特意针对爬虫做了优化，为什么内容反而不收录了呢？<br/><br/><strong>工程师分析：</strong><br/><br/>1、网站针对爬虫爬取做的优化，直接将图片二进制内容放到了html中导致页面长度过长，网站页面长度达164k；<br/><br/>2、 站点优化后将主体内容放于最后，图片却放于前面；<br/><br/>3、爬虫抓取内容后，页面内容过长被截断，已抓取部分无法识别到主体内容，最终导致页面被认定为空短而不收录。<br/><br/><strong>工程师建议：</strong><br/><br/>1、不建议站点使用js生成主体内容，如js渲染出错，很可能导致页面内容读取错误，页面无法抓取<br/><br/>2、 如站点针对爬虫爬取做优化，建议页面长度在128k之内，不要过长<br/><br/>3、针对爬虫爬取做优化，请将主题内容放于前方，避免抓取截断造成的内容抓取不全<br/>Tags - <a href="http://www.yuan-chuang.cc/go.php/tags/%25E6%2594%25B6%25E5%25BD%2595/" rel="tag">收录</a>
]]>
</description>
</item><item>
<link>http://www.yuan-chuang.cc/read.php/.htm#blogcomment</link>
<title><![CDATA[[评论] 页面长度过长，也会导致不收录？]]></title> 
<author> &lt;user@domain.com&gt;</author>
<category><![CDATA[评论]]></category>
<pubDate>Thu, 01 Jan 1970 00:00:00 +0000</pubDate> 
<guid>http://www.yuan-chuang.cc/read.php/.htm#blogcomment</guid> 
<description>
<![CDATA[ 
	
]]>
</description>
</item>
</channel>
</rss>