<?xml version="1.0" encoding="UTF-8" ?>
<rss version="2.0">
<channel>
<title><![CDATA[北京SEO_北京SEO培训 - 【元创SEO】]]></title> 
<link>http://www.yuan-chuang.cc/index.php</link> 
<description><![CDATA[元创拥有10多年网络营销和SEO实战经验、管理经验。 《SEO实战 - 核心技术、优化策略、流量提升》一书作者。SEO实战家、推一把联合创始人]]></description> 
<language>zh-cn</language> 
<copyright><![CDATA[北京SEO_北京SEO培训 - 【元创SEO】]]></copyright>
<item>
<link>http://www.yuan-chuang.cc/read.php/811.htm</link>
<title><![CDATA[数据分析：日志分析方法概述]]></title> 
<author>元创 &lt;&gt;</author>
<category><![CDATA[SEO策略]]></category>
<pubDate>Thu, 23 Jun 2011 01:23:07 +0000</pubDate> 
<guid>http://www.yuan-chuang.cc/read.php/811.htm</guid> 
<description>
<![CDATA[ 
	<strong>数据分析：日志分析方法概述</strong><br/><br/>前面我提到过【<a href="http://www.lxysem.cn/read.php/804.htm" target="_blank">SEO要学会数据分析很重要</a>】，大家可以先了解一下，还有要用的日志分析工具【《<a href="http://www.lxysem.cn/read.php/783.htm" target="_blank">光年SEO日志分析系统</a>2.0》免费下载 】。<br/><br/>日志在计算机系统中是一个非常广泛的概念，在<a href="http://www.lxysem.cn/" target="_blank">SEO</a>分析中也非常重要。任何程序都有可能输出日志：操作系统内核、各种应用服务器等等。日志的内容、规模和用途也各不相同，很难一概而论。<br/><br/>&nbsp;&nbsp; 本文讨论的日志处理方法中的日志，仅指Web日志。其实并没有精确的定义，可能包括但不限于各种前端Web服务器——apache、lighttpd、tomcat等产生的用户访问日志，以及各种Web应用程序自己输出的日志。<br/><br/>在Web日志中，每条日志通常代表着用户的一次访问行为，例如下面就是一条典型的apache日志：<br/><br/>211.87.152.44 – - [18/Mar/2005:12:21:42 +0800] “GET / HTTP/1.1″ 200 899 “http://www.baidu.com/” “Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; Maxthon)”<br/><br/>从上面这条日志中，我们可以得到很多有用的信息，例如访问者的IP、访问的时间、访问的目标网页、来源的地址以及访问者所使用的客户端的UserAgent信息等。如果需要更多的信息，则要用其它手段去获取：例如想得到用户屏幕的分辨率，一般需要使用js代码单独发送请求；而如果想得到诸如用户访问的具体新闻标题等信息，则可能需要Web应用程序在自己的代码里输出。<br/>为什么要分析日志<br/><br/>毫无疑问，Web日志中包含了大量人们——主要是产品分析人员会感兴趣的信息，最简单的，我们可以从中获取网站每类页面的PV值（PageView，页面访问量）、独立IP数（即去重之后的IP数量）等；稍微复杂一些的，可以计算得出用户所检索的关键词排行榜、用户停留时间最高的页面等；更复杂的，构建广告点击模型、分析用户行为特征等等。<br/><br/>既然这些数据是如此的有用，那么当然已经有无数现成的工具可以帮助我们来分析它们，例如awstats、Webalizer，都是专门用于统计分析Web服务器日志的免费程序。<br/><br/>另外还有一类产品，它们不分析直接日志，而是通过让用户在页面中嵌入js代码的方式来直接进行数据统计，或者说我们可以认为它是直接让日志输出到了它们的服务器。典型的代表产品——大名鼎鼎的Google Analytics，另外还有国内的cnzz、百度统计等。<br/>很多人可能会说，既然如此，我们为什么还需要自己来分析日志，有必要吗？当然有。我们的用户（产品分析人员）需求是无穷尽的，上面说的这几类工具虽然很好很强大，但显然没办法满足全部的需求。<br/><br/>无论是本地分析的工具，还是在线的分析服务，它们虽然提很丰富的的统计分析功能，可以做一定程度的配置，但是依然很有限的。要进行稍复杂点的分析，或者要做基于日志的数据挖掘，依然需要自己来完成。<br/><br/>另外绝大多数日志分析工具都是只能用于单机的，数据量稍大就没辙了。同时那些提供在线分析的服务对于单个站点通常也都有最大流量的限制——这是很容易理解的，他们也需要考虑服务器的负载。<br/>所以，很多时候还是得靠自己。<br/>怎么进行日志分析<br/>这并不是一个简单的问题。即使我们把“日志”限定为Web日志，依然包含了成千上万种可能的格式和数据，而是“分析”更是难以定义，也许是简单的统计值的计算，也许是复杂的数据挖掘算法。<br/><br/>下面并不打算讨论这些复杂的问题，而只是笼统的讨论如何构建进行日志分析工作的基础。有了这些基础会让基于日志的简单统计分析变得很简单，并让复杂的分析挖掘等变得可行。<br/><br/>Tags - <a href="http://www.yuan-chuang.cc/go.php/tags/%25E6%2597%25A5%25E5%25BF%2597%25E5%2588%2586%25E6%259E%2590%25E5%25B7%25A5%25E5%2585%25B7/" rel="tag">日志分析工具</a>
]]>
</description>
</item><item>
<link>http://www.yuan-chuang.cc/read.php/811.htm#blogcomment1895</link>
<title><![CDATA[[评论] 数据分析：日志分析方法概述]]></title> 
<author>锌合金抛光 &lt;user@domain.com&gt;</author>
<category><![CDATA[评论]]></category>
<pubDate>Thu, 23 Jun 2011 02:54:49 +0000</pubDate> 
<guid>http://www.yuan-chuang.cc/read.php/811.htm#blogcomment1895</guid> 
<description>
<![CDATA[ 
	不错，学习了
]]>
</description>
</item><item>
<link>http://www.yuan-chuang.cc/read.php/811.htm#blogcomment1896</link>
<title><![CDATA[[评论] 数据分析：日志分析方法概述]]></title> 
<author>FTP之家 &lt;user@domain.com&gt;</author>
<category><![CDATA[评论]]></category>
<pubDate>Thu, 23 Jun 2011 04:00:41 +0000</pubDate> 
<guid>http://www.yuan-chuang.cc/read.php/811.htm#blogcomment1896</guid> 
<description>
<![CDATA[ 
	很复杂啊。
]]>
</description>
</item><item>
<link>http://www.yuan-chuang.cc/read.php/811.htm#blogcomment1897</link>
<title><![CDATA[[评论] 数据分析：日志分析方法概述]]></title> 
<author>胡海啸 &lt;user@domain.com&gt;</author>
<category><![CDATA[评论]]></category>
<pubDate>Thu, 23 Jun 2011 06:44:11 +0000</pubDate> 
<guid>http://www.yuan-chuang.cc/read.php/811.htm#blogcomment1897</guid> 
<description>
<![CDATA[ 
	讲的详细，有进步了。
]]>
</description>
</item><item>
<link>http://www.yuan-chuang.cc/read.php/811.htm#blogcomment1901</link>
<title><![CDATA[[评论] 数据分析：日志分析方法概述]]></title> 
<author>80后创业 &lt;784688199@qq.com&gt;</author>
<category><![CDATA[评论]]></category>
<pubDate>Thu, 23 Jun 2011 10:29:41 +0000</pubDate> 
<guid>http://www.yuan-chuang.cc/read.php/811.htm#blogcomment1901</guid> 
<description>
<![CDATA[ 
	不是有点&nbsp;&nbsp;是 很复杂
]]>
</description>
</item><item>
<link>http://www.yuan-chuang.cc/read.php/811.htm#blogcomment1911</link>
<title><![CDATA[[评论] 数据分析：日志分析方法概述]]></title> 
<author>hellon &lt;1006769669@qq.com&gt;</author>
<category><![CDATA[评论]]></category>
<pubDate>Fri, 24 Jun 2011 07:59:08 +0000</pubDate> 
<guid>http://www.yuan-chuang.cc/read.php/811.htm#blogcomment1911</guid> 
<description>
<![CDATA[ 
	是啊 ，日志中的东西太重要了，网站出现波动，首先就应该相当查看日志，日志是了解搜索引擎的第一窗口
]]>
</description>
</item><item>
<link>http://www.yuan-chuang.cc/read.php/811.htm#blogcomment1948</link>
<title><![CDATA[[评论] 数据分析：日志分析方法概述]]></title> 
<author>广州佳和胃肠医院 &lt;43285748@qq.com&gt;</author>
<category><![CDATA[评论]]></category>
<pubDate>Mon, 04 Jul 2011 03:26:10 +0000</pubDate> 
<guid>http://www.yuan-chuang.cc/read.php/811.htm#blogcomment1948</guid> 
<description>
<![CDATA[ 
	日志都有那么多学问啊，看来好多东西要学哦
]]>
</description>
</item><item>
<link>http://www.yuan-chuang.cc/read.php/811.htm#blogcomment2790</link>
<title><![CDATA[[评论] 数据分析：日志分析方法概述]]></title> 
<author>泉州seo &lt;1010389494@qq.com&gt;</author>
<category><![CDATA[评论]]></category>
<pubDate>Tue, 11 Oct 2011 15:35:08 +0000</pubDate> 
<guid>http://www.yuan-chuang.cc/read.php/811.htm#blogcomment2790</guid> 
<description>
<![CDATA[ 
	日志分析方法概述
]]>
</description>
</item><item>
<link>http://www.yuan-chuang.cc/read.php/811.htm#blogcomment2810</link>
<title><![CDATA[[评论] 数据分析：日志分析方法概述]]></title> 
<author>淡雅花色真皮软床 &lt;chbwd2010@163.com&gt;</author>
<category><![CDATA[评论]]></category>
<pubDate>Wed, 12 Oct 2011 01:41:49 +0000</pubDate> 
<guid>http://www.yuan-chuang.cc/read.php/811.htm#blogcomment2810</guid> 
<description>
<![CDATA[ 
	新手SEO的宝典呀！！顶！
]]>
</description>
</item>
</channel>
</rss>