在第三方采集器完成抓取后,对原有数据进行下载,得到表格,最终需要的数据是链接父ASIN、链接上架时间、大类目排名这3列数据。此时需要提取字段6中的大类目排名,即#之后的内容,可以使用 Excel的分列功能完成该操作。
首先将排名后的大类目替换为#,此处为服装类目,即“in Clothing,Shoes &Jewelry”。
其次,选择Excel中的数据,单击“分列”按钮,选中“分隔符号”单选按钮,单击下一步按钮。
在“文本分列向导一第2步,共3步”对话框中设置分隔符号,勾选“其他”复选框,并输入#,可以看到在数据预览中,排名数据已经被单独分隔出来。单击“下一步”按钮并完成分列,删除其他列的数据即可。
此时仍有少数数据处于“Sports & Outdoors”户外类目中未被分列,为确保数据对比的一致性,可删除此类链接,或在新表格中进行分析。新建表格(对应名为“A关键词选品”的Excel表格,请根据学习需求下载查看),前三列分别登记抓取日期、ASIN、上架时间,第一行为抓取日期的链接排名。将每天抓取到的数据对应填入该表格中,即可整理出“tunic tops folwomen”关键词搜索下多数产品的排名变化趋势。
由于数据量可达到上万条,普通手动查找将十分烦琐,因此可以使用vlookup函数,将每天抓取的数据匹配至表格中。具体操作如下:首先在对应日期的单元格中输入“=vlookup(”,Excel将提示4个参数。
第一个参数为要引用的数据,此处可直接选中对应的ASIN,也可输入“B2”,并输入“,”,注意,这是英文逗号而非中文输入法的逗号。
第二个参数为查找的范围,打开抓取到的数据,选中ASIN和排名列,函数查找时将按照ASIN列进行匹配。
第三个参数为查找数据的序号,注意,这里的列数不是Bxcel默认的列数,而是查找范围的第几列。此处排名是选中区域的第2列,故输入“2”,最终查找时即可匹配到排名列数据。
第四个参数是选择匹配类型,因为需要精确查找排名,所以输入“FALSE”或者“0”。模糊查找输入“TURE”或“1”。最后补全右括号“)”,得到公式“=VLOOKUP(B2,部分抓取数据!E:F,2,0)”。向下填充其他单元格,最终即可获得表格。
1 链接排名存在周期性波动,周三周四高峰,周末低谷,与运营经验相符合。
2 即使是排名较前的链接,也不一定每天都出现在关键词搜索排名下。
考虑到链接周期性变化以及数据抓取延迟的因素,可以以7天为周期,取2个周期内的数据进行对比分析,后期运营者也可以选取多个周期进行综合对比。