Sep
5

如何解读Google Analytics渠道流量数据(一):流量是怎么算出来的

前言一:之前曾经写过一篇文章,是讲各种工具是如何将流量与转化归入各个渠道的,详见:谁在为你做marketing (一)。有些地方讲得还不是很清楚,主要是各种渠道之间的优先级的关系还比较模糊。

前言二:很多时候,我们在说到有多少的流量、有多少的转化是从直接输入或是从搜索引擎过来的时候。我们很少会去仔细研究,他们究竟是怎么过来的。如果你用GA或者是用其他的工具来衡量各个渠道的流量,通常与企业内部通过日志分析到的流量数据有差异,这种差异,通常就是由于这种计算逻辑的差异造成的。我们很有必要去了解这种差异造成的原因。这样做的好处是:1.帮助你了解流量来源真正意味着什么,而不仅仅只是一个数据,一个趋势;2.帮助你更好的设定市场投放的预算分配。废话不说,正文开始。

在Google Analytics里,流量的来源可以分为四个大类:

第一类:市场投放活动(Campaigns)

这一类比较常见的是付费关键词即Adwords,如果是Adwords,你不用加码,GA也能非常好的识别出来。当然如果你给自己的某个外部投放加上码,GA也会认为它是一个投放活动。投放活动在GA所有流量来源里,优先级别是最高的。

第二类:自然搜索(Organic)

这个大家很理解,就是Google和Baidu等自然搜索引入的流量。它对于GA来说,优先级别与Adwords是一样的。

第三类:推介网站(Referral)

这一渠道的流量主要是指从其他网站点过来的链接,比如友情链接等,这类来源通常是免费的。这一来源的优先级别低于市场投放活动和自然搜索。

第四类:直接输入(Direct)

直接输入包括几个方面,一个是直接在地址里输入网站,第二个是利用收藏夹与标签,第三个是从桌面软件,比如从QQ,MSN等软件点过来的链接,第四个是如果无法判别流量来源的话,也会归入直接输入。这个来源的优先级是最低的,大家抢的都是这个流量。

前面提到,这四类流量来源的优先级别是不一样的,就是说如果一个访客如果先后从这四种来源中过来,会发生覆盖的情况。比如你今天先在google里搜索来到网站abc.com,一个小时后,再直接输入abc.com,那么第二次访问的数据,还是会算成google搜索的流量,发生的转化也会这样算。

因为会发生覆盖,所以我们就很有必要了解在什么情况下会发生覆盖,在什么情况下不会发生覆盖。在了解这个规则之前,请先允许我介绍Google Analytics的几个时间设定:

1.Google Analytics的Cookie的有效时间是2年。就是说,如果你3年前来过网站,就算你电脑一直没重装过,也没删除过Cookie,GA都会认为你是新访客。

2.Google Analytics的Campaign Cookie的有效期是6个月。即如果5个前,你是从免费关键词过来的,之后再也没回来过,那Google Analytics还记得你是从这儿来的,因此如果今天你直接输入abc.com,Google Analytics还会把你算成是从免费关键词进来的。

3.Google Analytics设定的一次访问与会话的有效期是30分钟,这30分钟是指你不发生浏览行为的情况下,一次会话将在30分钟后失效,如果你是超人一直浏览,那么则会在凌晨12点的时候失效。

下面即将介绍的优先级原则,都是在上面这三个时间范围内有效的。

对于这四类流量来源,Google Analytics是如下来定义规则的:

一、同一次访问内覆盖规则:

1.投放活动永远能覆盖别的渠道

2.自然搜索永远能覆盖别的渠道

3.推介网站永远覆盖不了别的渠道

4.直接输入永远覆盖不了别的渠道

二、对于访客回访时的覆盖规则:

1.投放活动永远能覆盖别的渠道

2.自然搜索永远能覆盖别的渠道

3.推介网站永远能覆盖别的渠道

4.直接输入永远覆盖不了别的渠道

举两个例子来说明一下前面的覆盖规则:

案例1: 假设你从来没到过abc.com,今天通过google自然搜索进入了abc.com,那么cookie就记录下来,你是通过自然搜索进来的。此时你在浏览器内重新打开一个标签(前面那个还没关掉),还是用google搜索abc.com,这次则是通过付费cpc关键词点进了网站,那么这时cookie就会被覆盖,记录下你是通过付费关键词进入网站的。再新开一个标签,你在浏览别的网站时无意间发现在cba.com上有一个abc.com的链接,然后又点了过来(30分钟内),这个时候,覆盖没有发生,请注意:在同一次访问内,推介网站覆盖不了别的渠道。如果你还有兴趣打开一个标签页,然后直接输入abc.com的话,GA就不会理会这件事情,因为直接输入的优先级是最低的。如果你此时做了一次转化(比如下了个订单),在GA里看到数据将会是:

访问 转化
投放活动 1 1
自然搜索 0 0
推介网站 0 0
直接输入 0 0

案例2: 过了5天之后,你直接输入abc.com,然后再做了一次转化。此时GA里看到的数据会是:

访问 转化
投放活动 1 1
自然搜索 0 0
推介网站 0 0
直接输入 0 0

记住:直接输入永远覆盖不了别的渠道。

案例3: 又过了5天,再次从cba.com点击到了abc.com,然后做了一次转化,此时,覆盖发生了,注意第二条的第3小点,在不同的访问内,推介网站永远能覆盖别的渠道:

访问 转化
投放活动 0 0
自然搜索 0 0
推介网站 1 1
直接输入 0 0

案例4: 过了5个月以后,你直接输入abc.com进入网站,对不起,GA还当你是从cba.com过来的。

访问 转化
投放活动 0 0
自然搜索 0 0
推介网站 1 1
直接输入 0 0

类似的案例大家可以自己尝试做一做,就会明白GA里的渠道数据到底是怎么一回事了。对于那些新访客比重很高的网站来说,这种覆盖逻辑能产生的差异很小,而如果网站的日均旧访客比例超过50%的话,对流量与转化的渠道划分就会产生较大的影响。

56 Comments to “如何解读Google Analytics渠道流量数据(一):流量是怎么算出来的”

  • alen September 5, 2010 at 3:58 pm

    真复杂!!!!  (引用此评论)

    ReplyReply
  • Ken September 6, 2010 at 10:02 am

    终于时间弄清楚了  (引用此评论)

    ReplyReply
  • bnuhjr September 7, 2010 at 12:39 pm

    学习~  (引用此评论)

    ReplyReply
  • robin-li September 9, 2010 at 12:02 am

    我无意删除了我ga里面的配置文件,重新生成报告后。每日的搜索流量所占比数据明显减少了好几个百分比,
    根据你所说的

    “2.Google Analytics的Campaign Cookie的有效期是6个月。即如果5个前,你是从免费关键词过来的,之后再也没回来过,那Google Analytics还记得你是从这儿来的,因此如果今天你直接输入abc.com,Google Analytics还会把你算成是从免费关键词进来的”

    是不是因为我ga里面 的数据丢失了, 那些曾经是通过搜索来我们网站的访客如今继续直接访问我们网站 ,这部分用户的数据,没有将其归为搜索数据。所以导致搜索比例下降  (引用此评论)

    ReplyReply
  • hudie September 10, 2010 at 6:24 pm

    案例三没看懂。
    不就隔了10天
    怎么算“在不同的访问内”

    “Adwords的Cookie有效期是30天。”
    而且投放的优先级不是最高吗?  (引用此评论)

    ReplyReply
  • dave September 11, 2010 at 11:07 am

    @robin-li: 这个问题还要具体研究一下,不知道你是不是用同一个profile的号码。可能这个会产生影响。  (引用此评论)

    ReplyReply
  • dave September 11, 2010 at 11:09 am

    @hudie: 这里的访问是指session的意思,就是如果过30分钟不动就会过期。最长也只可能是一天。所以案例三所指的就是“不同的访问”。  (引用此评论)

    ReplyReply
  • robinli September 14, 2010 at 9:48 am

    @dave:

    是用同一个profile的号码 老id被删除 新id覆盖老数据  (引用此评论)

    ReplyReply
  • qingshan September 14, 2010 at 2:53 pm

    那也就是说,只有在第一次访问某个网站是时候直接输入网址才会被记为直接来源的流量,否则在其它情况下(无法识别reffer的情况除外)的访问都不可能被记入直接来源了?!  (引用此评论)

    ReplyReply
  • dave September 14, 2010 at 3:35 pm

    qingshan: 那也就是说,只有在第一次访问某个网站是时候直接输入网址才会被记为直接来源的流量,否则在其它情况下(无法识别reffer的情况除外)的访问都不可能被记入直接来源了?!  

    是的,根据GA的cookie覆盖逻辑,只有当时间过期,或者是别的优先级更高的cookie覆盖,才能改变原来的属性。因此你也可以去看,新访客的直接输入比例是很低的。  (引用此评论)

    ReplyReply
  • marsocean September 18, 2010 at 6:43 am

    看这篇文章,感觉又回到了在LA跟你讨论Coremetrics诡异的attribution逻辑的时候,呵呵。  (引用此评论)

    ReplyReply
  • dave September 18, 2010 at 8:50 am

    @marsocean:
    呵呵,是呀。你这次行程里,会过LA吧?怀念ing.  (引用此评论)

    ReplyReply
  • Lung tumors September 22, 2010 at 2:37 pm

    Reply hudie September 10, 2010 at 6:24 pm 案例三没看懂。不就隔了10天怎么算“在不同的访问内”
    +1  (引用此评论)

    ReplyReply
  • dave September 22, 2010 at 9:40 pm

    @Lung tumors: 这个访问是指会话的意思,就是一次访问的过程,隔了十天,肯定是算成两次访问了,呵呵  (引用此评论)

    ReplyReply
  • Mr.7eft September 29, 2010 at 11:12 am

    很复杂,我还是先去弄清楚渠道和目标等基本的东西吧  (引用此评论)

    ReplyReply
  • Mr.7eft September 29, 2010 at 11:17 am

    @hudie:

    Google Analytics设定的一次访问与会话的有效期是30分钟,这30分钟是指你不发生浏览行为的情况下,一次会话将在30分钟后失效,如果你是超人一直浏览,那么则会在凌晨12点的时候失效。

    10天,已经算是回访了。

    回访的话,参照以下

    3.推介网站永远能覆盖别的渠道。

    是可以覆盖的。

    不知道我这样理解对不对  (引用此评论)

    ReplyReply
  • dave September 29, 2010 at 2:21 pm

    @Mr.7eft:
    恩,很正确。  (引用此评论)

    ReplyReply
  • zl October 11, 2010 at 2:54 am

    关于覆盖的问题,不太认同,我没有测试验证(好像不太好测试,几百万流量的访问中比较难去验证几次测试访问)。
    我的理解是,流量来源是针对每次访问的,即每次会话有一个访问来源,此来源是通过landing page进入网站时的referrer。不同的会话之间不会发生覆盖的问题。
    比如,第一次进入网站的来源是自然搜索,会话结束后的另一次直接输入网址的新访问会有自己的直接来源,两次访问有两个来源,不会发生冲突。至少在自己采集的数据中,只计算会话中的第一个访问页面的referrer会比计算会话中的所有来源比较优先级更方便,更不用说还要去比较该用户在几个月之前是否有更高优先级的来源。
    还有个问题是,访问者几个月以前是“高优先级”的来源进入的,对现在是通过输入地址的直接来源归为广告/搜索引擎合适吗?  (引用此评论)

    ReplyReply
  • dave October 11, 2010 at 10:09 am

    @zl: 恩。你这种想法挺普遍的。其实网站分析工具是根据Cookie中记忆的信息来区别流量来源的,而不是根据目前这个session的referrer.
    如果只算第一次进来的来源的话,也会有问题。你可以观察一下你们网站的visits to purchase,如果一般都是在首次访问就发生购买,那其实用哪种算法问题都不大。如果visits to purchase在3以上,而只记第一个来源,那后面的来源就没有功劳了。而往往可能是后面的营销活动,比如email之类的促成了转化。这样以后能促成转化的来源反而得不到预算。
    反之,如果只计算last click,也会有这个问题。会把那些引入潜在顾客的渠道给削弱。
    这个问题很复杂,目前行业中没有真正统一的解决方案。要看情况而定。  (引用此评论)

    ReplyReply
  • Roger October 14, 2010 at 2:38 pm

    今天早上和负责百度竞价排名的同事在聊,他说他在几家公司的经验都是GA统计到的流量都要比其他统计系统的少,有时甚至是只有三分之一。我觉得GA应该不会犯这种低级错误,少统计了这么多流量,有可能是我们对其统计方法还不够了解。看了这篇文章,我猜会不会跟文章所提到的有关?还是有其他原因呢?  (引用此评论)

    ReplyReply
  • dave October 14, 2010 at 3:21 pm

    @Roger: 相比其他系统而言,GA计算流量的方式还算不错,至少不同的campaign之间的优先级基本是一样的。如果一个网站基本都是老访客,是可能造成你说的这种情况。有些系统会对自己的campaign设置特别高的优先级,这样流量就会显得高很多。  (引用此评论)

    ReplyReply
  • Roger October 14, 2010 at 9:13 pm

    @dave: 谢谢。不过我们的网站现在基本都是新用户,还有什么情况会导致GA的统计流量比其他系统的少吗?还望不吝赐教啊。  (引用此评论)

    ReplyReply
  • dave October 15, 2010 at 11:22 am

    @Roger: 其实最容易引起问题的是GA各种campaign加码没有加全。很多时候是用户没用好,不是系统的问题,呵呵。可能要去检查一下所有的campaign加码,以及内部的加码。  (引用此评论)

    ReplyReply
  • Roger October 15, 2010 at 6:15 pm

    @dave,哈哈,先怀疑我们自己。  (引用此评论)

    ReplyReply
  • 广州seo November 19, 2010 at 12:03 pm

    我一直还不清楚是怎么回事.这次总算明白了.  (引用此评论)

    ReplyReply
  • michelle November 29, 2010 at 12:05 pm

    cookie时效性的问题很复杂,我想问个实际当中遇到的问题,我们网站每次做EDM营销,直接来源都会增加400左右,这是什么原因呢,一直都没有分析出来,能不能指点下迷津,谢谢  (引用此评论)

    ReplyReply
  • dave November 29, 2010 at 3:08 pm

    @michelle: 如果直接从邮件里点击链接,参数又不能很有效的传过去的话,那这部分的流量都会计算成为直接流量的。  (引用此评论)

    ReplyReply
  • Michelle November 30, 2010 at 11:49 am

    你好,对于您所讲的渠道覆盖的问题我还是不太理解,在另外一个网站上看到的博主试验的结果好像跟您所讲的有点出入。
    http://www.stephensem.com/archives/15#respond  (引用此评论)

    ReplyReply
  • Michelle November 30, 2010 at 11:58 am

    4.直接输入永远覆盖不了别的渠道

    但那位博主试验结果确实是直接来源覆盖了推介来源  (引用此评论)

    ReplyReply
  • dave December 2, 2010 at 2:53 pm

    @Michelle: 你可以看那篇博文的最后一张表。描述的就是我所说的情况。呵呵。另外,还需要考虑是否是同一session的问题。  (引用此评论)

    ReplyReply
  • Michelle December 3, 2010 at 3:37 pm

    @dave: 谢谢,我再仔细研究研究  (引用此评论)

    ReplyReply
  • December 26, 2010 at 11:16 pm

    多谢前辈指点,小弟半路出家,学习中。。。  (引用此评论)

    ReplyReply
  • 冰冻西瓜 January 11, 2011 at 4:13 pm

    好厉害,都细化到这个程度啦!!!  (引用此评论)

    ReplyReply
  • eagle January 17, 2011 at 5:59 pm

    有两个问题请教:
    1.“这30分钟是指你不发生浏览行为的情况下”,浏览行为是什么样的浏览行为,cookie,session都是以域名做分隔,你不访问被统计的网站,而是别的网站,这也统计吗,这和cookie,session的原理行不通。
    2.“那么则会在凌晨12点的时候失效”,这个时间有时区又是如何算的,11点55点一次,12点05再点一次,又是如何统计的。  (引用此评论)

    ReplyReply
  • dave January 28, 2011 at 4:42 pm

    @eagle: 这个30分钟是指30分钟内有网页代码被执行。所以如果30分钟内你在别的网页看,或者盯着本站的网站看但没有点击或者是刷新,则session照样会失效。
    你提的第二种情况,一般是按本地计算机时间的。举的例子里算两次session.呵呵。这个东西比较搞的。  (引用此评论)

    ReplyReply
  • Slippor February 18, 2011 at 6:43 pm

    请教下博主,以上结论是您自己实验出来的还是和GA的人员沟通得出的?那像Omniture也是采用类似的逻辑么?  (引用此评论)

    ReplyReply
  • dave February 19, 2011 at 1:26 pm

    Slippor: 请教下博主,以上结论是您自己实验出来的还是和GA的人员沟通得出的?那像Omniture也是采用类似的逻辑么?  

    其实官方帮助文档里有这个说明的。也和中国负责ga的人聊过,是这个逻辑。Omniture的逻辑更复杂一点。默认是30days last click,不过可以自定义。  (引用此评论)

    ReplyReply
  • linyun000 May 7, 2011 at 2:09 pm

    博主您好,在http://myblogforwa.co.cc/?p=77看了测试,还有图表http://myblogforwa.co.cc/?p=78,是否是那样理解的?求证一下。  (引用此评论)

    ReplyReply
  • 千山暮雪 July 30, 2011 at 9:53 am

    这篇文章挺有用。收藏了  (引用此评论)

    ReplyReply
  • Jeff Chan August 1, 2011 at 10:24 am

    Hi, Dave, 之前阅读了你的译作,受益匪浅。

    这里有一个问题,如果我用Google的URL Builder来构建一个Campain链接,我把medium设置为 Direct, 这样通过这个链接过来的访问产生转换,这个转换会算到这个campaign里还是会算到之前的访问来源里?  (引用此评论)

    ReplyReply
  • dave August 1, 2011 at 5:35 pm

    应该是算到campaign里的。你这个来源之前是属于哪一个分类的?

    Jeff Chan: Hi, Dave, 之前阅读了你的译作,受益匪浅。这里有一个问题,如果我用Google的URL Builder来构建一个Campain链接,我把medium设置为 Direct, 这样通过这个链接过来的访问产生转换,这个转换会算到这个campaign里还是会算到之前的访问来源里?  

      (引用此评论)

    ReplyReply
  • Jeff Chan August 2, 2011 at 12:11 am

    谢谢。
    做了实验,通过查看cookie里的信息。无论之前来源是属于哪一个分类,这个Campaign里设置的信息都会把之前的信息覆盖掉。要想不覆盖之前的信息,在URL后边加上utm_noovertide=1的参数即可。
    GA现在可以注册使用first touch与last touch的conversion统计功能,但朋友申请了还没有回音。  (引用此评论)

    ReplyReply
  • dave August 2, 2011 at 3:53 pm

    谢谢你的信息。之前我好像看到过在加码的时候,可以自己定义为frist touch。因为默认是last touch的。

    Jeff Chan: 谢谢。
    做了实验,通过查看cookie里的信息。无论之前来源是属于哪一个分类,这个Campaign里设置的信息都会把之前的信息覆盖掉。要想不覆盖之前的信息,在URL后边加上utm_noovertide=1的参数即可。
    GA现在可以注册使用first touch与last touch的conversion统计功能,但朋友申请了还没有回音。  

      (引用此评论)

    ReplyReply
  • deng August 15, 2011 at 3:30 pm

    complex  (引用此评论)

    ReplyReply
  • deng August 15, 2011 at 3:30 pm

    complex  (引用此评论)

    ReplyReply
  • yanyi September 17, 2011 at 5:08 pm

    经过我的反复查看,dave在列出的cookies中来源覆盖关系的几条中,在非同一次访问中,推荐来源也永远无法覆盖其他来源。
    我试了很多次,确实是这样的,其他各种情况均如dave所说。  (引用此评论)

    ReplyReply

Post comment