
大数据文摘一直秉承分享、合作、共赢理念,愿意为大数据理念的落地贡献力量,如果你有“干货”愿意与大家分享,请给“大数据文摘”公号留言,只要对读者有益,我们愿意为您免费发表。
大数据文摘采编(转载请保留)
感谢湛庐文化和中欧商学院的邀请,4月25日下午,有幸现场聆听车品觉老师的精彩演讲,收获很大,整理如下精彩观点共享给大家。
搜索引擎如何优化?

上图中,上面是“货”,下面是“人”,大部分人只能看到“爆款”产品,但是有非常多的产品是无法看到的。所以我们通过优化搜索引擎,希望更多的、适合的产品展现在更多人的面前,但是效果不好。可是我们想了一个方法,在人群中先找到一个“达人”——所谓“达人”就是比比其他人更会挑选商品的人,TA们比人群中其他人的能力强,总能挑到物美价廉的商品。在大数据样本中,一般会有“达人”出现。定义了“达人”后,我们跟踪达人的行为,看TA是如何找到商品的?学习“达人”的搜索方式后,我们找到更多的好商品和店铺。然后我们会找到更多的“达人”,不断的寻找新的“达人”,但是必须要有足够的样本量,因为今天我是“达人”,未必明天还是“达人”。所以,流程如下图:
(1) 定义达人
(2) 侦测达人行为
(3) 发现特色长尾商品发现小而美卖家
(4) 揣摩达人决策
(5) 发现达人

大数据也有盲点

举个例子,今天早上我看到一件好的衬衫,上班后,在网上搜索,准备下单,这时老板找我去开会,我只能停止搜索。在会上,我觉得比较无聊,用手机继续搜索衬衫,结果看到广告,就花了100元买了一块手表。如果从后台数据分析会得出两个结论:(1)用户A在PC上搜索后,对那款衬衫不感兴趣(2)用户B在手机买了一块手表。如果不是这个人戴一个GoogleGlass,是无法还原真实的购物、浏览过程的,是不知道用户A和用户B是一个人,用户A并不是对衬衫不感兴趣,而是因为没有时间。所以,盲点是:以交易为核心而非以浏览为核心。
数据也有生命周期

数据是有生命周期的,不是所有数据都有用的,比如搜集一个关于网站浏览的数据,通常过了18个月,这个数据就没有用了。因为经过18个月,整个网站可能都变了。整改网站的变化会影响数据的生命周期。听说美国要做些法律改变,一个公司搜集个人的数据,只能保存最近6个月的数据。
最近的思考
(1) 数据开放还是不开放
(2) 数据存还是不存,如果存存多久?

数据十诫
(1) 好的问题、答案就在里面
(2) 在实践中提炼数据
(3) 让数据变成Technology,Enable更多人
(4) 让数据跟着“人”走
(5) 木有数据质量,神马数据都是浮云
(6) 以假设数据都能够获取去思考问题;
(7) 大数据安全,不是监管
(8) 利用数据拿到更多有用的数据
(9) 建立数据的数据,才有进步
(10) 让人做人擅长做的事、让机器做机器擅长做的事
趋势

DT:Data Technology
CI:Consumer Intelligence,就是以用户为中心的一种说法
更多精彩内容,请看新书《决战大数据》湛庐文化策划出版

车品觉
l国内大数据实践的先行者、数据观察家。现任阿里巴巴集团商业智能部副总裁、数据委员会会长。
l拥有多元化与国际化的教育背景。生于香港,在美国、英国、澳大利亚等地接受西方教育,曾于新南威尔士大学、斯坦福大学、INSEAD商学院及清华大学经管学院等世界一流学府进修。
l拥有十几年丰富的数据实战经验,并在实践中形成了独特的数据化思考方式,对电子商务未来趋势有独到见解。曾先后在汇丰银行、香港电讯盈科、微软、eBay等多家著名跨国公司任总监;曾任敦煌网首席产品官,创立了第一个以外贸交易平台为核心的搜索引擎。
l公益项目“桑珠助学”发起人,助学团队迄今在甘孜资助的学生已达600余人
数据分析, 数据挖掘