在亚马逊商品画像领域,除了可以对review、价格、排名做分布分析外,还可以针对商品listing标题进行词频分析。
词频分析是什么呢?词频分析(Word Frequency Analysis)是对文本数据中重要词汇出现的次数进行统计与分析,是文本挖掘的重要手段。其基本原理是通过词出现频次多少的变化,来确定热点及其变化趋势。
在亚马逊平台,词频分析的对象可以是review文本商品标题、listing五点描述、A+图文内容等文本内容,其中商品标题的词频分析在商品画像领域意义重大。
在“商品画像”的Excel文件中,商品标题列为不同搜索排序商品的标题文本。
为了方便进行自定义的词频分析,将“商品画像”Excel文件中19 152个listing抓取结果拆分成192个单独的Excel表格保存在名为“Frequencies ofKeywords”的文件夹中。
文件夹中不同表格文件记录了不同排序总数的词频分析结果,例如“Frequencies OfKeywords 100”表示搜索排序前100个商品listing的标题词频分析结果;“FrequenciesOf Keywords 200”表示搜索排序前200个商品listing的标题词频分析结果“Frequencies Of Keywords 1000”表示搜索排序前1000个商品listing的标题词频分析结果;“Frequencies Of Keywords 19 152”表示搜索排序前19152个商品(所有商品)listing的标题词频分析结果。
根据运营经验,不同搜索排序总数的商品标题词频分析结果一定各不相同,因此以搜索排序前100,以及搜索排序前19152(所有商品)的商品词频分析结果进行静态对比分析。
打开“Frequencies Of Keywords100”Excel表,就可以看到搜索排序前100的商品词频分析结果。
关于其他词汇的比较分析,仅仅只依赖两次静态词频分析的结果是不够的,因此需要对多个搜索排序的词频分析结果进行对照才可以获得结论。为此,笔者使用 Python制作了正序和倒序两个动态词频分析排列图视频给大家作为参考,视频名称分别为“正序动态排序图”与“倒序动态排列图”。
“正序动态排列图”展现了搜索排序从小到大(从100到19 152)时,不同标题单词出现频率的变化。一般而言,在TOP 20词汇中新出现的词汇/排序快速上升的词汇有两种含义:一种是中长尾卖家倾向于使用这类词汇;另一种是新上架的商品普遍具有该词汇代表的卖点。因此,运营者可以根据“正序动态排列图”视频来判断中长尾卖家与头部卖家运营习惯上的不同,同时可以根据不同卖点词汇的排序变化判断类目市场未来变化趋势。
“倒序动态排列图”展现了搜索排序从大到小(从19 152到100)时,不同标题单词出现频率的变化。“倒序动态排列图”中词汇的变化趋势代表了热卖商品标题文本的分布规律,如果运营者想要学习头部卖家编辑listing标题的技巧,可以通过观察不同词汇随搜索排序的变化优化自身的商品标题。
除了以上词频分析的方法以外,运营者还可以使用“词云图”进行静态分析。“词云”由美国西北大学新闻学副教授、新媒体专业主任里奇·戈登于2006年最先使用。“词云”就是通过形成“关键词云层”或“关键词渲染”,对网络文本中出现频率较高的“关键词”的视觉上的突出。
如果结合“商品画像”Excel文件中所有商品标题的文本生成“词云图”,得到“词云图”。
“词云图”中越突出(字号越大)的单词,其出现频率就越高,例如women’s、dress、sleeve、long、party、sleeveless等词就是高频率词,这与上述的词频分析结果一致。因此,“词云图”属于词频分析一种视觉上的展现方式,其分析结果与其他词频分析的结果并无差异。