在大数据面前,每个人都是透明的
「我的女儿还是高中生,你们却给她邮寄婴儿服和婴儿床的优惠券,这是在鼓励她怀孕吗?」 一个男子冲进一家商店,要求经理出来见他,并怒不可遏地说出了上述这句话。 几天后,经理打电话向这个男人致歉时,他的语气却变得平和了起来: 「我跟我女儿谈过了,她的预产期是8月份。是我完全没有意识到这个事情的发生,说抱歉的人应该是我。」 ——《大数据时代》 上面这段内容讲的是美国一家零售商通过分析大量女性的消费记录,根据购物的内容变化来推测怀孕的月份乃至预产期,据此来精准投放购物广告。 结果表明,拥有大量数据的机器比粗心的父亲更早知道女儿的身体状况。这无疑是让人汗颜的。 这个例子仅仅只是大数据应用的一个缩影。事实上,在这个大数据时代,万事万物产生的海量数据之中蕴藏着丰富的信息,把握好了就是无数的商机。 什么是大数据? 从字面的意思来看,大数据就是大量的数据。业界一般认为数据量达到普通的设备存不下,算不动的程度,就可以称之为大数据了。 「大数据又称为巨量资料,指的是在传统数据处理应用软件不足以处理的大或复杂的数据集的术语。」 —— 维基百科 「大数据是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。」 —— 百度百科 「大数据由巨型数据集组成,这些数据集大小常超出人类在可接受时间下的收集、庋用、管理和处理能力。」 —— MBA智库 从上面的几种定义可以看出,首先,数据量要大到常规方式无法处理的程度;再者,大数据作为信息资产,需要通过处理从中获取价值信息。 大数据到底有多大? 普通个人电脑所能存储的数据,一般是几百个GB到几个TB的级别。 例如,常见的固态硬盘,512GB就已经比较大了;常见的机械硬盘,可达1TB/2TB/4TB的容量。 表达数据容量的KB,MB,GB和TB之间的关系,大家应该都很熟悉了: KB(Kilo Byte) — 千字节,也就是1024B MB(Mega Byte) — 兆字节,也就是1024KB GB(Giga Byte) — 吉字节,也就是1024MB TB(Tera Byte) — 太字节,也就是1024GB 而大数据是什么级别呢?PB/EB级别。其实就是在TB的基础上每一级接着乘以1024。 PB(Peta Byte) — 皮字节,也就是1024TB EB(Exa Byte) — 艾字节,也就是1024PB ZB(Zetta Byte) — 泽字节,也就是1024EB YB(Yotta Byte) — 尧字节,也就是1024ZB 上述的这些大的单位在日常生活中几乎接触不到,而且常人也已经无法直观地感受到这些单位能大到什么让人吃惊的程度。下面我们举个简单的例子来说明。 一本《红楼梦》:纯文本(未压缩),约2MB 一张1200万像素的照片(未压缩):约34MB 一部90分钟的电影(H.264编码):约2.5GB(也就是2500MB) 这样算下来,一块1TB的硬盘大约可以存储50万本电子书,3万张图片,400部电影。假定三天时间看完一本书,这50万本就需要4000多年才能看完。 1PB的容量大约可存储5亿本书,3千万张图片,或40万部90分钟的电影。看书的时间过于夸张就不说了,这些电影也需要持续近140年时间才能看完。 1EB这个单位的庞大已经超乎了人们的想象,仅仅存放这些数据需要大约2000个机柜的存储设备。
如果并排放这些机柜,可以连绵1.2公里那么长。如果摆放在机房里,需要21个标准篮球场那么大的机房,才能放得下。 (编辑:新余站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |