大数据大数据的概念大数据(BigData)是指“无法用现有的软件工具提取、存储、搜索、共享、分析和处理的海量的、复杂的数据集合
网络上每一笔搜索,网站上每一笔交易、每一笔输入都是数据,通过计算机做筛选、整理、分析,所得出的结果可不仅仅只得到简单、客观的结论,更能用于帮助企业经营决策,搜集起来的数据还可以被规划,引导开发更大的消费力量
大数据与传统数据的区别
银行做数据业务做了十多年,那么大数据和传统数据的仓库有哪些差异
实际上就是群体和个体的差异
互联网数据完全瞄向个体,数据结构也是精准于个体,而传统的数据面向经营指标、面向群体
宏观意义上来看,假如小明去了一百次书店,以前要回答的问题是他第一百零一次买不买书,即业绩和经营指标的问题;而现在,互联网关心的是什么
最关心的是他第一百零一次买什么书,需要将什么样的内容推荐给他
这不是一个概率问题,而是一个模糊的程度问题
要量化这个程度,我们一定要基于个体,而不是基于群体的共性描述
传统定义上,更多关注的是一类人群,用同一类规则制订套餐给他们;而在互联网时代,要把每个人都精准刻画出来,进行精准匹配
有电商说他们要做到一百万用户要有一百万个商店,特别是在移动的小屏幕上,三次点击以后就会损失一个客户
所以差异化绝对不可能是对群体共性的描述,而完全是对个体差异的刻画
关于大数据的深度分析,很重要内容就是个性化的信息推荐
个性化的信息推荐不仅仅是基于用户的相似性这么简单的东西,还有大量比较深入的复杂模型
比如说,就用户看资讯而言,我们怎么样去判断一个用户点开一条八卦资讯后,是继续深挖八卦到死,还是转而浏览另外一个新闻
同样,有的用户登陆淘宝只是逛逛而已,有些用户则是很明确地想要买一些东西,这就需要对用户的意图进行预测,这里面涉及到一些比较难的机器学习技术
我们现在生活的是信息化的世界,未来会走向个性化
在这一点上有一个例子,耐克制作了一款