Google Analytics跟踪代码通过命中将带有参数信息的字符串发送到Google Analytics后台后,后台就要开始执行数据处理的动作。
(1)Google Analytics根据用户身份识别码,判定这个命中数据是属于谁的,是新用户还是老客户。
(2)将命中数据归入会话功能中。
(3)将命中数据与Google Analytics中的其他数据进行合并统计分析。
用户身份识别码是谷歌跟踪代码根据用户浏览器的Cookie随机生成的一个唯一身份ID,每一个!D对应一个具体的用户,如001对应的是张三,那么谷歌跟踪代码便绝对不会再将001对应到李四身上。当王五作为新用户第一次浏览安装了谷歌跟踪代码的网页时,谷歌跟踪代码便会根据王五所使用的浏览器Cookie为他生成唯一ID(假设大002),命中的数据发送给Google Analytics后台之后,因为系统中尚未有002这个ID,所以王五就会被视为新用户。
在同一个数据统计周期内,王五多次访问该网站页面,同时谷歌跟踪代码会将王五浏览网站页面所产生的多次命中数据发送到Google Analytics后台,后台检测出该ID为002,与系统中存在的ID完全符合,这时王五就变成了老用户。
但是有一种特例需要注意,王五虽然因多次访问某个网站页面而被Google Analytics标记为老用户,但如果某一天王五心血来潮清除了自己浏览器的Cookie,那么谷歌跟踪代码就会为王五生成一个全新的身份识别心,这个身份识别ID(已经不再是002,可能变成了005)被传到Google Analytics后,因为在系统中检测不到,所以此时的王五又被标记为新用户。
在识别出命中所传递的数据是属于老用户还是新用户之后,Google Analytics就需要对命中数据中的各项参数进行归类。知道,Google Analytics是一个统计分析工具,既然是统计分析,那么必然要确定一个统计分析的时间区间,将这个过程称为“会话”。
也就是说,网站页面上的跟踪代码不可能永远跟踪某个访客在网站上的所有行为并将其行为记录在一个会话单元内。这个会话将时间限定为该访客停止所有命中行为后30分钟(该时间限定可以更改,默认情况下是30分钟)。例如,某访客进入网站页面进行浏览,5分钟后打开了其他网站页面,其间没有再回到网站页面操作,那么从离开的那一刻开始往后顺延30分钟,该会话结束。
但实际上访客的浏览行为会比上面说的这种情况复杂得多,如某个用户访问了首页,然后他又打开另外一个新的浏览器标签页面并浏览上面的内容,可能因为页面内容过于精彩中途忘了回到网站页面上,直到30分钟后才想起网站页面,这时候他又回到网站页面上,点击播放了视频。那么对于这个用户,Google Analytics会将他在网站页面上的行为记录成2个不同的会话发送给Google Analytics后台。
第一个会话包含了一次网页浏览命中,第二个会话包含一个事件命中,视频播放这种交互行为被归类为事件命中,而不是网页浏览命中。
这些会话数据传输到Google Analytics后台被整理和计算出若干个统计指标,如会话次数、每次会话浏览页面数量、平均会话时长和跳出率等。这些数据会直接影响该网站页面在SERP中的排名,也是做谷歌SEO的侧重点。