邬贺铨院士:大数据会引发更多新业态出现

宽客网,量化投资,宽客俱乐部
                                            腾讯科技讯 (子辛) 8月13日消息,中国互联网协会理事长邬贺铨在下午举行的“名人堂——互联网趋势论坛”上表示,互联网产生大数据,而大数据也将变革互联网,引发新业态。

邬贺铨提供了一个关于互联网产生大数据的例子。2012年和2013年互联网所产生的流量,等于人们有史以来到2011年所产生的数据量总和。换句话说,两年等于一万年。

大数据引发新业态。邬贺铨表示,可以利用大数据提供咨询服务、提供客户关系服务、提供机器翻译、提供舆情等诸多服务。

以提供舆情为例,邬贺铨指出,洛杉矶可以告诉你今天哪个街区会犯罪,今天是哪个地方多就巡逻那个地方,其他不怎么巡逻,发现大大节省警力而且犯罪率下降。

除了互联网,移动互联网和物联网也将进一步推动数据的暴涨。大数据促进了信息融合和产业跨界结合,将引发更多新业态出现,大数据对互联网发展是机遇也是挑战。

以下是邬贺铨演讲实录:

各位专家下午好,我报告题目是大数据时代的互联网,讲三个方面内容,一个互联网产生大数据,一个大数据变革互联网,然后大数据引发新业态。

先说第一个问题互联网生产大数据,我们城市都有摄象头,一个小时产生很多的数据,几十万个摄象头我们数据达到数百个TB,所以这个数据非常大。除了政府以外企业产生大数据波音飞机,每个飞机来回都产生TB的数据。每几毫秒都测一个数据,每年数据很大,国家电网公司到去年10月份他收集数据很大,中国联通对用户上网都有记录,一个月记录一万多条,对应的数据量是几百个TB。医疗也是一个大数据我们看医院的病例可以看到,医疗数据一个大脑的CT扫描图要让它分辨率很高,微米的数据量产生是4.5TB的数据。我们现在像北京大学301医院门诊量一万人,同时按照医疗规定一个患者的数据要保存50年。这个图上广州中山大学医院,2008年这个医院数据是100个TB、到2013年是1000个TB。

淘宝网去年光棍节每分钟几十个TB的数据,腾讯每天有5万次计算,所以你可以看到网络有很多大数据,我们更多的数据量产生。美国的网站每分钟有72小时视频监控上载,互联网达到720TB每秒,相当于全世界有6亿人同时看不同的高清电影。2016年互联网三分钟传授300万小时的视频,相当于所有全世界生产电影,要34年不吃饭不睡觉才可以看完电影。最近美国网站上载的网量等于美国三大电视台所有电视播出总和。今年五月份中国视频网有3.95亿,当时统计网民是5.95亿。这个图象左边图是互联网的网民人均一个月使用的流量,08年达到一个G,到明年人均下载流量超过十个G。

现在大概全世界新产生的数据量每年增加14%,也就是说互联网每两年翻一番。2012年和2013年互联网所产生的流量等于人们有意识以来,一直到2011年所产生的数据量总和,两年等于一万年。2011年全世界互联网总量1.8个GB。2020年全世界的数据达到40个GB。这个重量相当于多少,相当于424艘美国的尼美兹号航母。

第二讲一下大数据变革互联网,大数据出现对互联网有很大的影响。有一种方式是演进型的,还有不考虑和互联网兼容我们说革命性的也有这个技术提案。两个方面技术提案彼此可以相用。现在很难说哪一种更能解决,总得来说我们希望互联网更安全更可信的。现在提的方式物理和逻辑分离,物理上有71个,和逻辑上分割办法对应不同服务,有视频的服务,数据服务,不同服务要求的服务质量是不一样的,所以物理上是一个网络,逻辑上可以组成不同网络,我们说把网络虚拟化,物理和逻辑分离。

其次传统路由器,有传送功能,也有控制功能,有业务功能,大数据出现我们发现网络上时空不对应,很难判断我哪个地方流量最高这个可以变的,因此现在变法把路由器网络控制功能抽出来,形成一个网络控制系统,把业务功能抽出来形成业务系统。灵活实现控制平面的建构,对于大数据流量是一种改型。随着流量增大,大部分流量过路多,落地少,凡是在光强上做的,就别在电厂做,凡是在IP上可以做的就不再IPO上做。IPO总召唤转变为承载,这只是一个包装,不是做一个召唤的功能了。召唤我们应该将来向召唤中心,要从承载分开。另外就是传统互联网IP地址表示主机的身份这个很正常,移动互联网的出现这个计算机从这到这里,位置变了,用户的身份没有变。身份和位置分离,身份在应用层面表示,这样分离好处支持移动性改变安全性。

信源中心和信息中心分离,这个图我们可以看到数据中心的发展,蓝色的是云计算数据中心,绿色是传统数据中心,从这个图可以看到到2015年所有的数据中心一半多以上都是云计算中心,都是大容量的。云中心一般考虑放在什么地方?一般考虑气候、能源工业,我们国家云计算中心会向高纬度地区集中,比如说内蒙一些凉快的地方迁徙,像谷歌把他云计算中心放在摩洛哥,因为那比较凉快。我们数据中心大部分在北京、上海、广州,而未来数据中心会放在内蒙偏远的地方,将来云计算的出现会把用户以信息源为中心,向以能源为中心改变,中心节点发生变化。过去我们上海、北京、广州是中心,现在随着大数据出现发现了不能这样做,我们需要增加这个数据和中心,美国网建互联中心有八个,我们现在有三个,中信部有计划增加这个中心。

全世界看来峰值国际流量增加3%,这个绝对值国际流量增加,相对值就是说拉丁美洲的用户到美国访问量占整个国家的流量比较,亚洲、欧洲、和非洲的。尽管国际流量增加,但是国际流量占整个流量比例是下降的,直接互联导致全国互联网去中心化。现在谷歌纷纷在中国香港等等地方上节点,这时候对外的访问没必要跨洋过海到美国去访问,你可以在本地,这个意义上国际互连网流量比例在下降,所以说全球互联网去中心化。另外大数据区域网络扁平化,这是中国电信的图,现在随着大数据出现所有省之间都直连,不这样安排根本没有办法支持这么大的流量。还有城域网的体系化,大计算机大的主机,我们很时髦客户服务器,所有客户访问网络都到服务器上,一个热门的结果这个服务器要传送无数遍给终端,每个终端需要在热门的地方下载一小部分,另外一个终端小在另外一小部分互相交换。我们叫P2P。这个终端访问服务器数据量很大,不是一个服务器装得下的,你可能只访问一次,但是服务器的交换很多,基本以上服务器之间在增长,进一步发展服务器增长变成云了,过去我们是客户的服务器,现在客户到云C2C,城域网体系要进行云化。

内容分配网络化,为了让用户更好更快接受,我们要做内容分配网。我们国家电信运营商在靠近用户的地方建了很多CDN,这样适应大家更快访问视频,CDN的部署对互联网流量流向产生了影响,我们国际互连网占比是降低的,我们网间流量比例也是降低的,绝对值增加,但是本地化的访问更多了,远端的访问降下来了。

移动网络一样,我们过去电话走电流交换,我们原来有基站,激战控制器网关。还有移动通讯天线分布化,我们国家移动通讯呼叫2009年所有呼叫发生室内是63%,家里29%,办公室占14%,越是大数据时代这个比例越来越高,室内转到WIFI,WIFI多了互相干扰,使用小蜂窝的技术,可以范围很小,损耗很小,因此调试率可以增加。一个蜂窝分成多个分布式的天线,这样有些蜂窝加上基站,但是蜂窝之间是统筹的,干扰统筹来解决数据量的传输问题。

从互联网到移动互联网将带来很大变化。互联网原来面向有线,由此用TC和IP没有问题。可是移动互联网的无线电路不可靠,如果继续用TCPR老同选,因此需要加入纠错编码,互联网面向PC端的,移动互联网自动检测网络的带宽和分辨。在传统电话话音传一百米到六百米,需要传一笔先令。

IBM从互联网新闻上PMI,一般PMI是政府上。美国印地安纳大学的学者,与谷歌提供情绪,从用户尽千万留言算道琼斯指数准确率到87%,淘宝的CPI和国家统计的CPI不一样,但是淘宝的CPI更能反映我们物价搬动。国家统计局的CPI主要参数是食品,经济好与不好除非太差人们才会把食品开支省下来,否则不会省吃饭的钱,淘宝反映买服装首饰,如果经济不好会反映出来,所以首长到淘宝看了一下说你们每天把这个数据送到中南海。大数据提供咨询服务,有一个人收集各个地块的产量和数据,哪个农产主问我明年种什么赚钱,他说赔了我赔你,比保险还要高。我在山东寿光看那个横幅,他说当地黄瓜一块钱一斤,当地黄光一毛钱一斤。农业除了天气占领市场心声,没有完全对企业都好的心声,可以用大数据提供咨询服务,还可以利用大数据到超市买东西,到超市买东西都打出条来,超市可以根据这个调配货物。哪些客户是最好买东西的客户,女性顾客最能舍得出买东西,女性里面孕妇,找出一些孕妇最常买的产品,没有刺激性的化妆品,关注一些婴儿东西等等,他判断这个是婴儿会把信息推送给他。我家里有一个上初中的女孩子你把孕妇东西送到我们这,结果过了几天,那家又道歉了说我误会这家公司了,我女儿意外怀孕了。

人人网通过客户关系的分析,游戏业务取得100%的增长。大家淘宝上买东西阿里公司把你的IP地址记下来,买首饰的用户IP地址,买化妆品的用户IP地址,买服装的IP地址,拿出来让卖化妆品和服装人竞价买这个IP地址。也就是阿里和商家网店得可以赚钱。百度搜索排名优先推荐,央视广告效果谁知道怎么样?央视去年的广告收入269亿人民币,百度广告收入229亿人民币,百度广告连增50%几,央视才增百分之十几,现在发现百度是我的竞争对手。

另外推动视频与互联网的融合,乐视网买到甄环传的网络播出独家权,搜狐视频拿下了中国好声音的版权,还有腾讯视频有一些快男被淘汰了,还可以复活,靠什么在YY上买东西复活选手。现在变成一个新媒体的融合平台。大数据提供集资服务,我们经济有压力,压力根据中小企业在平台上的表现,选出放心的中小企业,放贷一千多个亿,坏账率只有1.3%。今年7月份统计阿里靠贷款每天利息一百万,京东收购了网民在线,从信用卡分期贷款,你在京东买东西留地址什么,他提供贷款。苏宁建立小贷公司解决贷款问题,他为了他的营销创造很好的条件。

刚才是说互联网企业进入金融,那么金融企业也不能坐以待毙,平安保险跟百度合作,涵盖保险银行投资,利用大数据分析消费者在网络的消费情况。中信银行使营销模式陪送从2周缩短到两天,客户开发率提高30%。互联网企业进入金融迫使金融企业加快互联网化。

银行业进入电商,过去我们银行业不做电子商务,现在平安银行做电子商务,把握客户偏好本身习惯包括风险,搞了平安好车网,到这个网上告诉你什么车型什么比较,4S店服务怎么样。同时它做金融不能只提供这个,涉及贷款、租赁二手车抵押这一块,建行、招行、民生银行等等统统往电子商务发展。把街景数据获得我们开车可以没有人,这里面发现还有一个手,实际上没有握方向盘,我们公安局规定驾驶室的位置必须坐人,即便是无人驾驶也得做这个人进去,否则不符合公安局的规定,这个人没有开车根据街景自动驾驶。我们北京的一卡通,如果把数据收集起来我们知道北京多少人从哪里换车,每天怎么流向,我们现在中国很多地方有数据的不挖掘,会挖掘的没有数据。要把生活和网络结合起来。

这是上海的江苏路所有路都有摄象头,每个摄象头后面都有电视屏放在交通管理中心,一个交通管理中心再大也放不下这么多屏,因此10秒钟一轮换,通过大数据挖掘把一条马路的交通组成一个视频,把整个上海交通组织像一张图,就像上海市领导直升飞机俯视上海一样。这是以色列的首都的交通流量,不同颜色表示不同的事件,有些表示事故等等,这些政府统计出来以后,广播给所有开车的人。我们现在虽然有交通屏,往往看到堵车显示我车前进也前进不了,后退也后不了,人家是非常实时的提供到你这个广播里面,所以这是很好的服务。

另外旅游很快到国庆了,到国庆之前很多人在网上搜索网游点,还有酒店,私家车的路线,根据你搜索我们知道哪个旅游点最热,那条路会堵,真正发生黄金周的时候我提前可以知道,大家可以用微信短信研究发生的热点。百度成立了定位事业部,以地图为载体,覆盖到餐饮、KTV、上商场等。阿里有保护中心,在移动端加强与高德地图合作。腾讯推出会员卡,加上财富通和搜搜地图,线上线下本地化营销你可以看到现在我们所有网络都要跟地图结合。要跟位置结合,要跟本地生活结合。大数据提供医疗这个同时谷歌判断每个一个城市产生流感,一旦这个地方有流感,网民会搜索我这个症状是不是流感,到哪个医院治好,谷歌跟这些判断哪个地方有流感,这个可以体现预测到。

我们利用短信、微博微信我们知道收集热点和舆情,我们腾讯对每个用户都建档案。一个老头注册的时候说是18岁少女,无论用什么假名你在网上时间长了一定露出你的本性,他说我不但知道你是男的,女的,老的,少的,我还知道哪是神经病。如果公安局要查神经病我可以提供一堆神经病的IP地址。上周美国大西洋周刊报道纽约一对夫妇,男的搜索高压锅夫人搜索包,结果六个人要造炸弹,这个可以分析。

洛杉矶可以告诉你今天哪个街区会犯罪,今天是哪个地方多就巡逻那个地方,其他不怎么巡逻,发现大大节警力而且犯罪率下降。

现在进一步发展这是微软比尔盖茨,他对全世界员工讲话,现在只要找到一张比尔盖茨照片把比尔盖茨声音传过来,动嘴巴,口形和表情对应。我让这计算机看一个猫,我看完以后让计算机看两万张没有看过的照片,找猫达到15.8%。

有一个大学教授搞人脸识别系统,你不要随便应答我就知道你张三李四来的。大家在街上看到某个人带着不像自己的小孩,拍下来送到百度网站对比,如果对比率达到100%,百度就会通知家长来认。手机都有摄象头,你只要一得手机就可以打开了。你现在相亲,长多高多富都很难弄,他说我希望这个女的长的多漂亮,选一个你认为漂亮的女生一对脸,在网站找一个差不多的就会提供你这样的女生。

大家有这么多访问到我谷歌,网上有这么多文章,我可以在这个里面找到例句,我根据规则,只要跟例句差不多就可以了。现在翻译用途也是很多的。百度可以看到这是昨天统计今日电影排行榜,小时代,环太平洋等我说有些电影不好看,我只管收集热,也可能骂得人多了也排在上面,不见得排上面最好。前一段富二代,什么富春山居图,小时代什么不好的电影也上来了,我们可以看热点人物。

美国大选期间7月3号还没有选出来,当时统计奥巴马是47.9%。靠个性化的工作来做,台湾说你们马上开十八大了,怎么没看你们领导人做活动,我们领导人是一天到晚都在考虑怎么建设小康社会。

现在互联网企业当轻运营商,我们看到互联网现在企业除了管道需要运营商,现在其他东西都不需要依靠运营商都需要独立判断。公安局有微信公众号,招商银行也有,这些都可以很好的各种各样的增值服务都可以出现。电信运营商开展互联网活动,银行做电商互联网企业做金融,阿里控制电商的入口,腾讯主刀线交入口,他们希望向对方业务拓展,固定想做移动,移动想做固定,广播做电信,电信想做广播,运营的卖手机,手机的想做运营,现在很难区分大家的业务。我们看到自留地要种,别的也要搞,现在整个是浑浊了。电商和搜索会产生新的业态。

互联网产生大数据,移动互联网和物联网进一步推动数据的暴涨,网络中心体现去中心化,大数据促进了信息融合和产业跨界结合,大数据引发更多新业态出现,大数据对互联网发展是机遇也是挑战,是对我们国家互联网创新能力的一次大考,谢谢大家!
数据分析, 数据挖掘



                                                    风险提示及免责条款

市场有风险,投资需谨慎。本文不构成个人投资建议,也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场,不承担相关法律责任。如若转载,请注明出处。 如若内容造成侵权/违法违规/事实不符,请点击【内容举报】进行投诉反馈!

相关文章

立即
投稿

微信公众账号

微信扫一扫加关注

返回
顶部