运营者完成数据采集和“清洗”工作以后,就要对数据进行分析和处理了,数据分析一般分为两类:数值分析和可视化分析。
数值分析最常见的应用方式就是Excel中的“数据透视图”,将以订单报表中的地理位置信息为例来进行讲解。我们首先打开“4.2.4数据分析”的Excel 文件,将表格中名为“ship-state”的列进行全选,然后在Excel上方的工具栏中选择“插人”,点击“数据透视图”。
我们在弹出的页面中直接点击“确定”即可,点击完以后,页面会转移到“数据透视图工具”中。我们在页面右方的“数据透视图字段”中将“ship-state”字段分别拖拽到下方的“轴(类别)”和“值”中。
最后,我们就可以得到不同地区的订单数量及对应的可视化图表了。
我们通过可视化图表可以明显看出该款式的主要订单来自加利福尼亚州(CA)佛罗里达州(FL)得克萨斯州(TX)和纽约州(NY)。
数据分析的另一个重要内容是时间分布。用户购物习惯分析可以理解为用户每日的购物峰值在哪里、不同地区用户购物高峰期是否不同。将把时间与地区这两个维度结合起来,通过对一系列数据进行整理与分析得到不同地区的用户购物习惯。数据来源仍然是后台数据中的订单报表,筛选方法分为两类:24小时总订单量变化规律、不同地区24小时订单量变化规律。
完成数据筛选以后,我们就可以构建用户购物习惯可视化图表了。
我们来看一下单月24小时订单量和平均客单价变化图。
用户购物习惯分析可以理解为更深一层的单日订单量波动分析,即将不同地区的单日订单量波动进行数据筛选和可视化处理,读者可以直接下载表格“4.2.4用户购物习惯分析”进行查看。
此外,运营者还可以根据加利福尼亚州(CA)、佛罗里达州(FL)得克萨斯州(TX)这三个地区的订单报告,将三个地区不同时间段的订单量进行对比。
筛选出不同地区不同时间段的订单量以后,运营者需要计算三个地区不同时间段的订单比例来确保用户画像数据的准确性。
我们可以得出比例计算公式。
CA、FLTX三个地区不同时间段的订单比例=地区单一时间段产生的订单/
地区所有时间段产生的总订单
完成数据筛选以后,运营者就可以结合不同的数据进行可视化分析了,如果运营者需要结合所有地区观察店铺总体订单量趋势的话,那么可以绘制“店铺总订单量单日变化趋势柱状图”,其横轴为1天 24小时,纵轴为所有地区的总订单量。