
随着几本书的热销,整个科技领域貌似被带入了一个新时代,叫做"大数据时代"。从事数据相关的人员,特别是分布式计算的工程师,庆幸自己赶上了开往大数据时代的轮船,回头一望,看到身后大量饥民正奔涌而来......
有些精明的人,趁机办起了“大数据”技术培训班,教授hadoop,hive等带有大数据标签的技术。然而,很多人,始终都还在迷茫,究竟什么是大数据时代?大数据能称为一个时代吗?大数据时代与信息化时代是什么关系?这个时代盛况又是什么样子?我该将自己置身于哪个位置和角色?
什么是大数据时代?
最早提出“大数据”时代到来的是麦肯锡,麦肯锡称:“数据,已经渗透到当今每一个行业和业务领域,成为重要的生产因素。人们对于海量数据的挖掘和运用,预示着新一波生产率增长和消费者盈余浪潮的到来。”
如何理解数据作为重要的生产要素呢?
此前的生产过程中,追求产品的标准化,生产过程是个黑盒,输入输出是固定的。现在很多自动化生产过程,也用到程序控制,用到知识和数据啊?然而,这些所谓的知识和数据,通常都是事先设置的常量,生产之前就固定好的。
大数据时代的生产过程,数据是个变量。例如,在面包生产工厂,把订单中顾客口味喜好作为原材料,输入到面包机中,产出的面包正好符合每个顾客的口味。面包工厂并不因为太个性化而增加成本,因为在这个社会中,数据已经和水一样,是最基本的原材料了。
过去的时代,我们要极力控制环境的变化,避免其对产品质量造成破坏,大数据时代我们要拥抱环境的变化,让变化作为产品的基因。大数据时代的产品,没有绝对的标准化,更多的体现个性化和创造力。
上述的一切有什么理论依据吗?我们常听说“唯一不变的就是变化”,“世界上没有一条绝对的直线”,我们感觉这个说法是对的,但不知其出自哪里,是否具有普遍意义。
本文试图用混沌理论里的一些思维方式来看清大数据时代的面目......
大数据时代的定位
大数据时代能称为一个时代吗?还是一个炒作卖机器的泡沫概念。如果真的具有划时代的意义,那么它与过去其他的时代是什么关系呢?
我们过去通常划分了机械化时代、电气化时代、信息化时代,每个时代都改变了世界、改善了我们的生活。这几个时代的关系是继承和递进的关系,下一个时代以上一个时代为基础。
其实,混沌理论里的分形理论能更好地概括这个关系。什么是分形,看看下面这个图就明白了?
是什么?分布式计算存储?深度学习?总是感觉有些单薄和勉强....
大数据时代能如何地改变生产和生活?生产更加的自动化、智能化?人们生活更加自主、自由、个性?总觉得不够革命性。
大数据时代的猜想
混沌世界的特征除了“脱胎”之外,还有一个特征就是“涌现”。发展到达新阶段后,此前的各种抑制因素不复存在,“生产力”得到空前的释放和发展,会涌现出千千万万的新的成果。如:民国期间的文化艺术的百花齐放,信息化时代的互联网应用的雨后春笋,改革开放后下海创业的风起云涌,PC机的发明后信息产业的迅猛发展。
可以试想经过现今的混沌阶段,进入大数据时代的平衡发展期后,各种应用也会如雨后春笋、百花齐放。
青出于蓝而胜于蓝,信息化时代的烙印逐渐被磨掉,人们喜闻乐见的是新时代的新生事物。然而需要明白的是,新时代的出现并不是对旧时代的替代,只是抢了旧时代的风头,新时代的信息化、电气化、机械化依然在发展,而且是大数据时代得以站立的肩膀。
能否yy一下大数据时代的场景?
目前,除了气象、水文、地址研究机构之外,“大数据”主要来自于互联网应用和政府对公众服务业务中产生的关系和记录,这在人类社会活动与环境关系中产生的数据中,还是沧海一粟。大数据时代数据采集的面将会更加广,数据加工会更加的细,数据的应用将是革命性地繁荣。
医疗领域将会产生大量的应用,每个人的生理特征和状态都会被采集和分析,目前发现的各种疾病都会找到根源。偶然的治疗措施或偏方都会被全世界共享。
60亿个人就是60亿个海量存储的硬盘,也是60亿个数据处理站,这里有无尽的数据和无尽的知识宝藏等待分享和发掘。假想有那么一天,将一个头盔戴在全国最后一个抗战老兵的头上,用视频直播他的艰苦抗战历程和人生中的精彩画面,让人们看到真正的历史。
随着物联网技术的应用普及,人与物、物与物的交互还会产生大量的数据。顺丰快递的货运班机上,包裹与包裹会交朋友,“hi,我们都来自淘宝店....”
在大数据时代,数据的采集将走向大自然,向自然界要数据。每个人、每个动物、每棵植物都是天然的数据观测站,他们时时刻刻听到的、见到的、闻到的、想到的内容都将是大数据的来源。也许我们会重新定义动物和植物,也许真能看到小草朝我们撇嘴和微笑。
大数据时代的分工和角色
类比过去的时代,站在大数据时代舞台中央会是哪些角色呢?
设备制造商
生产数据采集、加工设备的公司,通常由电脑产业中的主要制造商转型而来,着力解决数据的采集、转换、计算、存储、传输问题。
数据处理解决方案服务商
集成数据采集加工设备,为行业应用提供系统搭建服务。大数据时代的还会强调从海量数据中萃取知识,数据挖掘和知识发现也是技术竞争的制高点之一。
数据交易市场
数据不会被关闭在一家公司里,成为公司的私有资产。数据就像石油一样,蕴藏在大自然中,需要千千万万的人去采集和加工,然后放到交易市场去售卖,最后被注入到生产车间。面向全社会的数据交易市场会成为大数据时代的一个巨头。
......
时代的发展总是不可预知的,上述的各种推测都是不准确的;然而,时代的发展也逃脱不了自相似的规律,我们可以从旧时代的发展轨迹中推测新的迹象......
摘自:阿里技术嘉年华
数据分析, 数据挖掘