通过采集某店铺的消费者在线上留下的文字(聊天记录、评论等),利用PQ编辑器对“字典”的调用,将消费者线上留下的文字进行拆分,再将拆分后的词进行分组统计,提取出现频率较高的词,对其进行分析和筛选处理,再通过Excel的“数据透视表”功能对数据进行筛选,并通过图表使数据可视化,进而得出相关的数据分析结论。

(一)打开数据源

打开数据源“项目六任务四消费者舆情分析”。

(二)将数据导入PQ编辑器

在菜单栏中选择“数据”选项卡,单击“来自表/区域”按钮,在弹出的“创建表”对话框中选择数据的区间并勾选“表包含标题”复选框。

(三)PQ编辑器处理数据

在菜单栏中选择“添加列”选项卡,单击“自定义列”按钮,

将“新列名”改为“Participle”,在“自定义列公式”中输入公式“=Csv. Document (Web. Contents("http://api.pullword.com/get.php?source="&Uri.EscapeDataString([Evaluation])&"&.param1=0.8& param2=0"))”,单击“确定”按钮。

在弹出的“隐私级别”对话框中勾选“忽略此文件的隐私级别检查……”。

单击“Participle”字段右侧的双向箭头,选择“展开”,勾选“Column1”。

单击“Participle .Columnl ”字段右侧的筛选按钮,选择“删除空”。

在菜单栏中选择“主页”选项卡,单击“分组依据”按钮,在弹出的“分组依据”对话框中, 以“Participle .Columnl”为分组依据,“新列名”改为“count”,“操作”改为“对行进行计数”。

单击“count”字段右侧的筛选按钮,选择“降序排序”选项。

(四)数据导出PQ编辑器

在菜单栏中选择“主页”选项卡,单击“关闭并上载”下拉按钮,在下拉列表中选择“关闭并上载”选项。

(五)创建数据透视表

在菜单栏中选择“插人”选项卡,单击“数据透视表”按钮,弹出的“创建数据透视表”对话框,在“表/区域”中选择所分析的数据区间或表名,数据透视表置于“新工作表”中。

将"Participle.Column1”字段拖人“行”标签框,将“count”字段放人“值”标签框,设置“值显示方式”为“求和项”。选中“求和项:count"字段的数据,右击,选择“排序”中的“降序”。

(六)插入图表

在菜单栏中选择“插人”选项卡,单击“推荐的图表”按钮,在弹出的“插入图表”对话框中选择“所有图表”,图表类型选择“柱形图”中的“簇状柱形图”。

(七)图表优化

单击“Participle.Column1”字段右侧的筛选按钮,选择“值筛选”中的“前10项”,在弹出的“前10个筛选(Participle.Column1)”对话框第二个文本框中输人“20”。

显示柱形图的“数据标签”,删除“网格线”与“垂直坐标轴”,将图表标题改为“前20词频分析”。

(八)数据分析

可以得出,前20词频中,排除“the ”“will”等词,好评词远远多于差评词。可以发现消费者关注的某些需求,如“shipping ”“quality ”“service”等,店铺可以根据这些需求判断自己是否达到要求。

(本文内容根据网络资料整理,出于传递更多信息之目的,不代表连连国际赞同其观点和立场)