金融工程

Twitter野心:收购两家欧洲电视数据分析公司

Twitter周一宣布,该公司已经收购了两家欧洲电视数据分析公司,一家是总部位于法国的Mesagraph,另一家则是总部位于英国的SecondSync。Twitter同时还表示,该公司将扩展与广告调研和咨询公司Kantar Media的合作关系,合作在海外推出电视节目和媒体评分服务(TV Ratings)。Twitter此前已与尼尔森合作,在美国市场推出了电视节目评分服务

微博泄露你的性格 数据分析让你无处藏身

每年全球企业在直销上的投入力度都在万亿级别以上——无论是消费者收到的广告电子邮件还是各种实体宣传资料(仅美国去年的投入资金就是1700亿美刀)。但在这些被动接收广告的人群中,只有3%的人最终有了任何的购买行动。如果这些广告资料是电子形式的,那么最终浏览率只有0.1%,而线上广告的交易转化率只有可怜的0.01%。也就是老美每年的1650亿美刀都用来骚扰民众,制造垃圾了。这

大数据知识科普:中国数据量有多大?

这是一个注定要被拍砖的问题,但是这样拍着改着也可能就真明确了。所以无论如何,还是先抛出块砖头吧。我们都在说大数据时代来临,信息和数据大爆炸。从2013年初开始,对于大数据爆发的焦虑感,紧迫感,不由自主地被卷入的甚至无力的感觉,驱动众多行业、企业和团体去关注和开始接触和了解大数据,自觉或不自觉的,主动或不得已地去融入这波洪流。但是,真的说到大数据,我们身边到底有多少数据量,

原来是这么玩,解析全球十大电信巨头如何玩大数据

以4G为代表的移动互联网时代,令信息、互联网行为数据、话单数据、WAP日志/WEB日志、互联网网页、投诉文本、短信文本等结构化数据以及非结构数据呈现几何式增长。面对新型海量数据,传统电信运营商正面临越来越大的挑战:[u]客户与内容服务提供商联系更加紧密,但对电信企业的忠诚度反而下降;企业无法通过流量内容服对于电信运营商而言,没有哪一个时代能比肩4G时代,轻松掌握如此海量

漫谈大数据的思想形成与价值维度

到上世纪50-60年代,磁带取代穿孔卡片机,启动了数据存储的革命。磁盘驱动器随即发明,它带来的最大想象空间并不是容量,而是随机读写的能力,这一下子解放了数据工作者的思维模式,开始数据的非线性表达和管理。数据库应运而生,从层次型数据库(IBM为阿波罗登月设计的层次型数据库迄今仍在建行使用),到网状数据库,再到现在通用的关系数据库。与数据管理同时发源的是决策支持系统(DSS),

用大数据思维缓解交通拥堵

近日,高德软件有限公司董事长兼CEO成从武在接受记者采访时表示:尽管有关部门一直在想办法治理交通拥堵,但在北京、上海、广州等大城市,交通拥堵成了“家常便饭”。我们希望在全社会倡导绿色出行,也希望利用大数据和互联网思维来观察研究如何解决城市交通拥堵。成从武指出,为了解决城市交通拥堵,不同国家不同城市采取不同的方法或者方法的组合,归纳起来主要是两类,一类是通过行政手段,一类是通

关于LDA与pLSA

今天偶然看到一则消息:2013年ACM-Infosys基金会奖授予了David Blei表彰他在主题建模领域的先驱作用(http://www.acm.org/news/featured/awards/infosys-award-2013)。他与老师Michael Jordan及吴恩达2002年合作提出的Latent Dirichlet Allocation(LDA),已经

2014年度大数据十大发展趋势

1.数据资源化这一候选发展趋势得到了委员们最多的关注。数据的资源化是指大数据在企业、社会和国家层面成为重要的战略资源。2014年大数据将成为新的战略制高点,是大家抢夺的新焦点;大数据将不断成为机构的资产,成为提升机构和公司竞争力的有力武器。2.大数据隐私问题大数据对于隐私将是一个重大挑战,现有的隐私保护法规和技术手段难于适应大数据环境,个人隐私越来越难以保护,有可能会出现有

向谷歌百度要解决问题的方法

如果你是一个数据分析工作者,你一定留意到身边有很多人在卖力啃excel高级函数,执着到“无所不高”的境界,甚至常常因此小题大做,抓耳挠腮,执着于Excel高级函数的技术控,或许应该尝试向谷歌百度要解决问题的方法了。某天,A君突然紧急呼叫:有一个表格问题折磨许久没有办法解决,谷歌百度搜索也未有结果,求救!问题是这样的(涉密数据已转换),如图,现在需要从B列的字符串中,提取最

大数据分析前沿

美国科学院、工程院联合发布的一个《大数据分析前沿》( Frontiers in Massive Data Analysis,网上可以下载到 )报告,Committee由Michael Jordan领衔,成员包括CMU的Kathleen Carley, 哈弗的Trevor Hastie, Google的Diane Lambert等,内容包括:数据管理、实时算法、大数据表示、人