DM 数据挖掘技术 的成本问题
DM 数据挖掘技术 现在很多软件都说自己有这个功能, 就像四,五年前的数字电视一样,凡是有点与数字电视有丝毫联系,或者只用了与数字电视沾点边的,都说自己是数字电视....
但是四五年后 数字电视 还真实现了.... 真不知道数据挖掘4,5年后会怎么样....
但是现在普通的计算机的计算能力 还远不能胜任 数据挖掘的计算量....
看看 我一个朋友对数据挖掘的看法..
不过我还是对数据挖掘的前景比较乐观的...
DM的陷阱 - [投资与创业]
Tag: [
[color=]创业
](http://adxon.blogbus.com/s16506/) [
[color=]DM
](http://adxon.blogbus.com/s1021437/) [
[color=]互联网
](http://adxon.blogbus.com/s13180/) 摘自:http://adxon.blogbus.com/logs/10181982.html
作者:Jo
在与创业者的交流中,DM(数据挖掘)被提到的频率很高,创业者们总是希望得到更多的用户有效数据,通过分析这些数据,达到“让对的人在对的时间看到对的推荐(广告或商品)”的效果。这种想法具有普遍性,却存在一些问题:
互联网创业者希望提供其用户最简单易用的操作体验(服务)的愿望,和他们希望得到更多的用户有效数据的愿望之间,往往是一对矛盾。从简单易用的角度来说,用户总是希望“付出”更少,“获得”更多;而用户“付出”越少,可供网站DM的数据就少了,DM的有效性就会减弱。
DM技术尽管已不再神秘,但大部分实施的案例水平依然比较平庸。迄今,我以为Amazon的推荐引擎仍是 最好的DM应用之一,尤其在如此庞杂的数据量和数据种类面前,依然能有为人称道的良好表现,足见其DM的技术实力。而对于国内广受爱戴的豆瓣推荐,已经有不止一人告诉我,豆瓣推荐对他们已经没什么用了:推荐的书、电影都看过了,或者是根本不喜欢看的。而我也发现,[
[color=]豆瓣
](http://douban.com/)认为“和我口味最接近的人”里居然有一个和我只有一本书的共同爱好,这的确有些牵强。
与问题相应的有一些补充内容,希望对创业者有益:
要点是预期,当用户预期其“付出”有相应的回报时,自然愿意“付出”。比如,用户在[
[color=]当当网
](http://dangdang.com/)上订购图书时,如果不“付出”真实的地址和联系方式,所购书籍将无法及时送到。又如,用户在[
[color=]last.fm
](http://last.fm/)“付出”的原因则是希望得到更多适合其口味的音乐推荐。
有效数据种类多少与推荐精确度呈正相关性,但是种类越多,对于DM技术的要求也越高,实施的成本也越高。很多情况下,数学上通畅的计算过程却无法在当今最好的计算机上迅速得到运算结果。所以,DM技术的关键在于精简变量和简化算法。如果现有人脉中没有这样的高级技术人才的话,还是将希望建立在更实际的地方更稳妥。
DM是一件高成本、高门槛的事,即便是国内Web 2.0翘楚的豆瓣做的水平也比较一般。创业者在思考产品和服务的时候,还是应更多地结合自身情况,做好力所能及的工作,以保证自己赚到力所能及的利润。 by ArisZheng
数据分析, 数据挖掘, color, 创业者