西安美林大数据季刊合集 内部资料 百度、阿里、腾讯三巨头开挖大数据 2014-04-14 概念、模式、理论很重要,但在最具实干精神的互联网领域,行动才是最好的答案
国内互联网三巨头 BAT 坐拥数据金矿,已陆续踏上了大数据掘金之路
BAT 都是大矿主,但矿山性质不同 数据如同蕴藏能量的煤矿
煤炭按照性质有焦煤、无烟煤、肥煤、贫煤等分类,而露天煤矿、深山煤矿的挖掘成本又不一样
与此类似,大数据并不在“大”,而在于“有用”
价值含量、挖掘成本比数量更为重要
百度拥有两种类型的大数据:用户搜索表征的需求数据;爬虫和阿拉丁获取的公共 w eb 数据
阿里巴巴拥有交易数据和信用数据
这两种数据更容易变现,挖掘出商业价值
除此之外阿里巴巴还通过投资等方式掌握了部分社交数据、移动数据
如微博和高德
腾讯拥有用户关系数据和基于此产生的社交数据
这些数据可以分析人们的生活和行为,从里面挖掘出政治、社会、文化、商业、健康等领域的信息,甚至预测未来
西安美林大数据季刊合集 内部资料 下面,就将三家公司的情况一一扫描与分析
一、百度:含着数据出生且拥有挖掘技术,研究和实用结合 搜索巨头百度围绕数据而生
它对网页数据的爬取、网页内容的组织和解析,通过语义分析对搜索需求的精准理解进而从海量数据中找准结果,以及精准的搜索引擎关键字广告,实质上就是一个数据的获取、组织、分析和挖掘的过程
除了网页外,百度还通过阿拉丁计划吸收第三方数据,通过业务手段与药监局等部门合作拿到封闭的数据
但是,尽管百度拥有核心技术和数据矿山,却还没有发挥出最大潜力
百度指数、百度统计等产品算是对数据挖掘的一些初级应用,与 Go o gle 相比,百度在社交数据、实时数据的收集和由数据流通到数据挖掘转换上有很大潜力,还有很多事情要做
西安美林大数据季刊合集 内部资料 2 月底在北京出差时,写了一篇《搜索引擎的大数据时