有数据分析经验的运营者都知道,获取的第一手数据一般是无法直接进行分析的,这时就需要对数据进行“清洗”。人工采集的数据一般不需要“清洗”,因为运营者在人工采集时会对数据做一个筛选,数据采集结束以后可以直接对获取的数据进行分析和判断。运营者需要结合特定的分析目的对报表采集的数据进行“清洗”。

亚马逊运营数据

例如,在运营者进行用户购物习惯分析时,最关键的数据就是订单报表中的订单时间数据。初始的订单数据为“2019-03-29T16:34:49-07:00”T之前的数据是日期, T之后的数据是下单时间。如果要做用户画像分析,运营者需要的是数据中的订单小时时间即“16:34:49”中的“16”那么就需要对这些数据进行“清洗”。

我们首先打开电子文档中的“4.2.3数据清洗”Excel文件,然后使用Excel软件中自带的“MID”函数在“2019-03-29T16:34:49-07:00”数据中从第12位起取2个数字,就是最终需要的时间“16”。已经完成了数据“清洗”工作,读者只需要将“清洗”内容删除再重新操作一遍即可。

除了对时间数据进行“清洗”,运营者还可能对地理数据或其他订单数据进行“清洗”其处理方式和时间数据处理方式大同小异。


(本文内容根据网络资料整理,出于传递更多信息之目的,不代表连连国际赞同其观点和立场)