大数据是指以多元形式,自许多来源搜集而来的庞大数据组,往往具有实时性。这些数据可能来自社交网络、电子商务网站、用户来访记录,此外还有许多其他来源。这些数据,并非公司用户关系管理数据库的常态数据组。

从技术上看,大数据与云计算的关系就像一枚硬币的正反面一样密不可分。大数据必然无法用单台计算机进行处理,必须采用分布式计算架构。它的特色在于对海量数据的挖掘,但它必须依托云计算的分布式处理、分布式数据库、云存储和/或虚拟化技术。在维克托·迈尔-舍恩伯格和肯尼斯·库克耶编写的《大数据时代:生活、工作与思维的大变革》中大数据指不用随机分析法(抽样调查)这样的捷径,而采用所有数据进行分析处理。大数据的特点通常被称作4V,具体是指:volume(大量)、velocity(高速)、variety(多样)、value(价值)。

著名未来学家阿尔文・托夫勒在《第三次浪潮》一书中,将大数据热情地赞为“第三次浪潮的华彩乐章”。美国互联网数据中心指出,互联网上的数据每年将增长50%,每两年将翻一番,而目前世界上90%以上的数据是最近几年才产生的。此外,数据又并非单纯指人们在互联网上发布的信息,全世界的工业设备、汽车、电表上有着无数的数码传感器,随时测量和传递着有关位置、运动、震动、温度、湿度乃至空气中化学物质的变化,由此也产生了海量的数据信息。

大数据是与人类日益普及的网络行为相伴而生的,它是被相关部门、企业采集的,蕴含数据生产者真实意图、喜好的,非传统结构和意义的数据。从海量数据中“提纯”出有用的信息,这对网络架构和数据处理能力而言也是一项巨大的挑战。在经历了几年的批判、质疑、讨论、炒作之后,大数据终于迎来了属于它的时代。大数据时代已经来临,它将在众多领域掀起变革的巨浪。但我们要冷静地看到,大数据的核心在于为客户挖掘数据中蕴藏的价值,而不是软、硬件的堆砌。因此,针对不同领域的大数据应用模式、商业模式研究,将是大数据产业健康发展的关键。我们相信,在国家的统筹规划与支持下,通过各地方政府因地制宜地制定大数据产业发展策略,通过国内外IT龙头企业以及众多创新企业的积极参与,大数据产业未来发展前景将十分广阔。

其实,大数据就是互联网发展到现今阶段的一种表象或特征而已,没有必要神话它或对它保持敬畏之心,在以云计算为代表的技术创新大幕的衬托下,这些原本很难收集和使用的数据变得很容易被利用。通过各行各业的不断创新,大数据会逐步为人类创造更多的价值。


(本文内容根据网络资料整理,出于传递更多信息之目的,不代表连连国际赞同其观点和立场)