(1) 数据采集
企业内部数据采集来源于各个业务生产系统,包括CRM数据、呼叫中心(Call Center,CC)数据、财务数据、仓储数据、门店数据、销售数据、办公自动化 (Office Automation,OA) 数据物流数据、网站数据。
企业外部数据是指数据在企业外部产生,企业通过合作、购买、采集等形式获得的数据。企业外部数据通常包括竞争数据、营销数据、物流数据、行业数据等
(2)数据存储
数据存储是在数据源的基础上,通过数据仓库技术 (Extract-Transform-Load,ETL) 进行数据整合,形成供上层计算或业务使用的数据仓库及数据集市。
数据仓库面向上层数据应用或业务决策,是一个面向主题的、集成的、相对稳定的、反映历史数据变化的数据集合。
(3)数据计算
数据挖掘按照不同的实现结果可分为回归模型、聚类模型、关联模型、时间序列、分类模型和机器学习等。
数据计算按照计算结果输出的时间性可分为实时计算和离线计算,部分企业还会在实时计算和离线计算之间加入临时计算。
数据计算模块对于大多数中小企业来说没有必要单独拆分,原因是在较小的数据体量和应用需求下,完全可以通过数据实时计算获得结果。数据计算模块只对大中型企业或具备海量数据处理需求的企业有意义。
(4) 数据管理
数据管理层是连接数据和应用的桥梁,通常上层自动应用或产品化的所需数据直接由数据计算层调用。对大多数企业而言,数据管理层的功能定位是用户管理和数据管理。
数据管理通过数据管理平台 (Data Manage Platform,DMP) 实现,但现在大多数的DMP产品仍集中应用在底层数据的整合和抽取等工作上,尚未上升到数据管理层面
(5)数据应用
辅助决策应用是目前数据发挥价值的主流方式,包括自动化营销、站内个性化推荐、数据产品化报表等。
数据驱动需要借助技术手段实现,通常使用的是建立在数据事件触发或数据结果触发基础上的自动化运行机制。常见的数据驱动项目包括实时竞价 (RealTime Bidding,RTB) 、个性化EDM、站内个性化推荐、个性化着陆页、网站智能运营、基于用户事件或时间的维系触发等