有过数据分析工作经历的运营者都知道,采集到的第一手数据一般都是无法直接进行分析的,这时候就需要对数据进行“清洗”。

跨境电商数据化运营的步骤之数据清洗

对于人工采集的数据一般不需要清洗,因为人工采集时就会主观上对数据做一个筛选,所以数据采集后可以直接进行分析和判断。

对于报表采集的数据需要结合特定的分析目的进行清洗。

初始的订单数据为“2019-03-29T16:34:49-07:00”的格式,而如果要做用户画像分析,运营者需要的是这段数据中的订单小时时间即“16:34:49”中的“16”,那么就需要对这些数据做数据清洗的操作。

首先打开“数据清洗”的Excel文件(如果图表已经完成数据清洗工作,读者只需要将清洗内容删除再重新操作一遍即可)。

然后使用Excel软件中自带的“RIGHT”函数,将“2019-03-29T16:34:49-07:00”数据中的“2019-03-29T”去除。

紧接着使用Excel软件中自带的“LEFT”函数将“16:34:49-07:00”中的“-07:00”去除。

最后再使用一次“LEFT”函数将“16:34:49”一类数据简化为“16”的小时数据。

除了对于时间数据的清洗外,运营者还可能涉及地理数据或者其他订单数据的清洗,其处理方式和上文提及的操作大同小异。

自动化抓取采集的数据需要结合相关编程语言进行清洗,因此属于IT领域的知识,有兴趣的卖家可以自行查阅相关资料进行学习。

(本文内容根据网络资料整理,出于传递更多信息之目的,不代表连连国际赞同其观点和立场)