【深度】另类视角看百度迁徙图

宽客网,量化投资,宽客俱乐部
                                     【CCTV的赞誉】摘自CCTV晚间新闻

        今天全国春运已经进入第10天,越来越多的人通过海陆空不同的方式往家里赶。36亿春运大军里面哪条返乡之路最热?不同的旅游线路的人们又有哪些特别的故事?“据”说春运,让我们用数据说说春运背后的故事。30年来,春运大军从原来的1亿人次,增长到今天的36亿人次,在春运这么短的时间内,36人次的大迁移,在过去我们真的很难去想象全国到底是怎样的景象?感谢大数据,在2014给我们带来最为直观的感受,下面这张图是百度提供的迁徙动态图,这些美丽的亮线就是春运路上大家的足迹,如果您使用过智能手机,并使用过定位功能的话,那么从您踏上旅途的那一刻开始,从出发地到目的地的数据就会在这张图上画出一条淡淡的线,人越多,这条线就会越亮。

大数据还告诉了我们什么,首先是最热线路排行榜,截止到今天晚上7点,8小时内排在前三位的是上海到滁州,天津到德州,还有成都到北京,一个非常有意思的发现是,成都往返北京的线路已经连续占据热门线路的前十名,昨天甚至排名第一位。橙色的线代表迁入成都的人流,而黄色的线代表迁出成都的人流量。

宽客网,量化投资,宽客俱乐部

        但是我们发现,不管到达还是出发,成都站都很热,而成都铁路局统计的数据也恰恰印证了这一点,从春运当天开始一直到昨天晚上8点,从成都火车站直达北京的人数为7335人,增幅较2013年超过60%,要知道春运30多年来,没到春运的前半段,差不多是这个时候,成都站所面临的最大压力是到达客流所带来的,但是今年,他们在原来的基础上,在送出旅客方面,同样投入更多的精力,也许呢,大数据到现在还不能具体的分析出乘车人的身份,不过成都火车站的一线人员有个特别的发现,那就是今年出发的人流当中,多了很多老人的面孔,而这在以前并不多见,老人们挤进春运大军都是要去儿女打工的城市准备过年,这样充分印证了专家的分析:逆向迁徙正在改变着今年的春运......

【我的疑惑】
为何是百度?从央视的报道可知,百度的算法是近似算法,前提是要用智能手机且使用过定位功能,有了这两个前提,百度才可以采集到所需数据,近似估计出哪部手机可能从哪出发到哪回家,才能画出这壮观精美的图画,但是从整合社会资源的角度看,这是巨大的浪费,因为百度所有需要的数据,铁路局都有,而且不是近似值,是精确值,清楚知道每个乘客的年龄、籍贯、性别、出发地、中转站、目的地,所以我要问:为什么是百度画出了这张图,而不是你,铁路公司!
新闻应该多严谨?如果要说明“逆向迁徙正在改变着今年的春运",至少应该拿些数据说话,到底今年春运这段时间有多少人“逆向”,有多少老人“逆向”?而不是仅凭火车站一线人员的某些“特别”发现。况且,老人一般都会与打工者错峰出行,未必使用智能手机,也不一定会用定位功能。而且,“逆向迁徙”这词可不是今年才开始用,搜搜百度“春运 逆向迁徙”,满眼都是去年春运的文章!所以建议,新闻应该严谨的要传达准确含义,应多做功课,不能只做“新”而不用“心”!

[/ol]  

【老读悟的担忧】以下内容为授权转载

摘自:老读悟(微信公号:laoduwu666,博客:http://data12345.com/

一种失望和担忧——再谈大数据的价值

       一个央视和某巨头的合作项目,一个大数据、高科技风口浪尖的项目,顷刻间,各大小媒体的铺天盖地的称颂、赞美之词溢于言表,这是要“刷媒体”的趋势啊,仿佛大家都要说的什么,而我也要说点什么,说点做项目、做产品的初心,说点对国内大数据未来的担忧。

百度迁徙确实做了一些东西,海量数据的小时级处理,一定的可视化技术。但无论从项目思想、还是可视化的主体而言,都不是什么创新的东西,类似的、雷同的东西,相信从业者几年前就见过。并且,最重要的,它说到底是一个事后对数据的描述和展示,目前阶段的实际价值能有多大?对解决老百姓息息相关的春运问题的实际价值点在哪里?对政府的资源调配、社会决策能有多少立竿见影的效果?从现实情况看,恐怕还是新闻效应、政府关系效应效果更明显一些。

       当然,这些都没有问题,毕竟有了新的数据、新的信息可参考,聊胜于无。但回归做产品、做项目的初心,我们为什么要做这样一个项目,真的是在为用户解决痛点问题吗?

       大数据产品也是如此,真的是在用大数据为潜在用户解决实际问题吗?从大数据的概念提出,到目前也有几年时间了,国内一直处在“谈必大数据”的概念炒作阶段,不知道造就了多少砖家、叫兽。就拿春运来说,老百姓面临的问题是什么?怎么回,什么时候回,怎么中转,怎么抢到票,怎么避开中途可能的异常情况,甚至配套的黄牛识别问题,这些都是和大数据息息相关的,怎样采集更广泛的外部数据,怎样构建模型发挥大数据的分析及预测价值,怎么通过大数据产品的可视化技术连接用户,都是要考虑的环节。

       对政府类用户而言,也有各种各样的问题需要大数据支持:各种交通资源的调配问题,特定交通线路的最优设计问题,异常时间的实时定位问题,交通拥堵的预测问题,甚至春运问题与老百姓满意度的问题,等等。

       报个创新,搞个公关,这些真的不是最重要的,请回归做产品的初心吧。也期待大数据从业者可以从价值出发,推动国内大数据产业的良性发展,驱动更有价值大数据产品出现。
数据分析, 数据挖掘


风险提示及免责条款

市场有风险,投资需谨慎。本文不构成个人投资建议,也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场,不承担相关法律责任。如若转载,请注明出处。 如若内容造成侵权/违法违规/事实不符,请点击【内容举报】进行投诉反馈!

立即
投稿

微信公众账号

微信扫一扫加关注

返回
顶部