对于广大数据信息客户来讲,最关心的并非数据的分析处理过程,而是对大数据分析结果的解释与展示(即数据展现)。因此,在一个完善的数据分析流程中,数据结果的解释步骤至关重要。如果数据分析的结果正确但是没有采用适当的解释方法,则所得到的结果很可能让客户难以理解,在极端情况下甚至会误导客户。
数据解释的方法很多,比较传统的就是以文本形式输出结果或者直接在电脑终端上显示结果。这种方法在面对小数据量时是一种很好的选择:但是大数据时代的数据分析结果往往是海量的,同时其结果之间的关联关系极其复杂,采用传统的解释方法基本不可行。这时可以考虑从下面两个方面提升数据解释能力。
1)引入可视化技术
可视化作为解释大量数据最有效的手段之一率先被科学与工程计算领域采用。通过对比分析结果的可视化,用形象的方式向客户展示结果,这种图形化的方式比文本形式更易于被理解和接受。
常见的可视化技术有标签云(Tag Cloud)、历史流(HistoryFlow)、空间信息流(SpatialInformation)等。在数据可视化工具中,报表类工具有JReport、Excel、水品易表,FineReport等: BI分析工具有Power BI.Style Intelligence、BO、BIEE、象形科技ETHINK、Yonghong Z-Suite等:国内的数据可视化工具有BDP商业数据平台、大数据魔镜、数据观、FineBI商业智能软件等。大家可以根据具体的应用需要选择合适的可视化技术和工具。
2)客户参与分析过程
让客户能够在一定程度上了解和参与具体的分析过程。这里既可以采用人机交互技术,利用交互式的数据分析过程来引导客户逐步地进行分析,使得客户在得到结果的同时能更好地理解分析结果的由来:也可以采用数据起源技术,通过该技术帮助客户追溯整个数据分析的过程,有助于其理解数据分析的结果。
报告撰写
数据分析完成后一般会要求撰写数据分析报告,这是对整个数据分析过程的总结,是向企业决策者提供的一种参考,可为决策者提供科学、严谨的决策依据。一份优秀的数据分析报告,需要一个明确的主题,需要一个清晰的框架,以图文并茂地阐述数据、条理清晰地展现效果,使决策者能一目了然地看出报告的核心内容。最后需要加上结论和建议,并提供解决问题的方案和想法,以便决策者在进行决策时作为参考。