金融工程

如何对建模型数据进行预处理

当今现实世界的数据极易受噪声,丢失数据和不一致数据的侵扰,低质量的数据将导致低质量的挖掘结果,数据预处理技术可以提高数据质量,从而提高数据挖掘结果的质量和性能。数据预处理的方法主要有如下三种:数据清理、数据集成与变换、数据归约。数据清理例程通过填写缺失值、光滑噪声数据、识别或删除离群点并解决不一致性来“清理”数据。分析中往往包含来自多个数据源的数据,这涉及集成多个数据库、数

谷歌的票房预测模型揭秘

【导语】近日,谷歌公布了一项重要研究成果 – 电影票房预测模型。该模型能够提前一个月预测电影上映首周的票房收入,准确度高达94%。这在业内引起了强烈讨论,不少内人士认为该模型非常适合好莱坞电影公司通过预测票房来及时调整电影营销战略,但同时也有吐槽者暗示谷歌的票房预测模型别有用心,旨在鼓动电影公司购买其搜索引擎广告。那么,孰是孰非,谷歌票房预测模型以及大数据在电影行业的应用是

用数据分析AV女优,寻找下一位苍井空

2008年,美国国家工程学院对25000名工程师进行调查,并借此总结出一份他们心目中21世纪将要面临的宏大挑战,这是预测,同时也是创新的根源推动力。在排名前14名的挑战中,例如“先进的个性化学习”“制造用于科学探索的工具”“增强虚拟现实”……等等已经在过去的五年里得到了飞速的发展。当年,因为诸葛亮对天气的预测,让他成功的借来东风,又凭借对周瑜的人性预测,让他成功的逃脱魔爪

NBA 用大数据改变比赛

其实NBA获胜的途径还可以利用大数据!通过扩大大数据算法、机器学习技术的应用和新视觉呈现方法的设计,来把数据转化为有价值的信息,最后“帮助优秀的团队获得胜利。”你知道吗,在篮球比赛中,投篮地点和拿下前场篮板的几率存在着一个固定的关系:球员每远离篮板一英尺,拿下前场篮板的几率就会降低1%,但到三分线时,几率又突然变大;此外,90%投丢的球都可以在距离篮板11英尺的范围内拿下。

以“上大学分析”为例体验什么是数据挖掘

谈到BI,就会谈到数据挖掘(Data mining)。数据挖掘是指用某些方法和工具,对数据进行分析,发现隐藏规律并利的一种方法。下面我们将通过具体的例子来学习什么是数据挖掘。案例“上大学分析”-体验什么是数据挖掘某社会机构,收集了大量的学生考大学的数据。该机构希望找出一些规律,以推动更多的学生考大学。该机构委托你来做这个分析工作,给出具体的可以推动更多学生考大学的建议。

大数据的四大误区

大数据是时下最热门的一个词无疑,几乎可以在所有行业听到关于它的讨论。但人们依旧对大数据有一些误解,今天给大家推荐的是来自@微软数据视界 编辑的@快刀青衣的《大数据的4个误区》:金融工程, 数学算法, 大数据, 误区原文发布于宽客论坛,点击阅读原文

用大数据来组建你的超级团队

当“球探”遇上大数据会产生什么样的化学反应?美国奥克兰市运动家棒球队,曾因采用数学模型来预测球员成绩、遴选球员而大面积改变了球队成绩,创造了美国棒球联赛史上最长的连续获胜记录。《大西洋月刊》编辑Don Peck 特别报道《HR遭遇大数据:他们在盯着你工作》中,描述了数据分析对于职场人力资源工作带来的变革。比利·比恩(Billy Beane)曾是奥克兰市运动家棒球队的总经理。

表格的应用

由于工作原因,经常接触到表格。我们发现,表格不但广泛的运用在各类数据收集和分析,同时通过表格这样一种二维矩阵来整理和陈列信息时(即便最后的展示方式并非一个典型的表格样式),能够很好的表达信息之间的逻辑关系,易于帮助理解横纵信息之间的关系。在实际的网页设计应用中,表格横纵相互独立又相互关联的模式尤其适用于:1.组织和展示大量的信息表格简单的结构不但能包含大量的信息,且同

数据到底如何搞定电影票房预测?

怎样利用微博数据从股市中掘金?气象台怎样预报天气并发布预警?Google如何通过搜索行为预报流感爆发?这些有趣的问题背后,其实都隐藏着大数据的影子。基于对搜索行为、社交媒体等数据的深入分析,可以测量亿万用户的情绪变化、描绘用户的行为模式、挖掘用户的潜在需求,最终发掘出数据中蕴含的真正价值。2009年Google在《Nature》上公布了其利用搜索数据对全球流感疫情近乎实时

【戏说大数据】向林彪同志学习数据挖掘

【不打无把握之仗】林彪从红军带兵时起,身上就有个小本子,上面记载着每次战斗的缴获、歼敌数量。每次打完仗,林彪就亲自往上面添加数字,并为之沾沾自喜…令人感觉到这个23岁任军长,25岁就当军团长的人,似乎有点小气。1948年辽沈战役开始之后,在东北野战军前线指挥所里面,每天深夜都要进行例常的“每日军情汇报”:由值班参谋读出下属各个纵队、师、团用电台报告的当日战况和缴获情况。