第一章1、2011年麦肯锡研究院提出的大数据定义是:大数据是指其大小超出了常规数据库工具获取、储存、管理和()能力的数据集
A:计算B:访问C:应用D:分析答案:分析2、用4V来概括大数据的特点的话,一般是指:Value、Velocity、Volume和()
A:VarietyB:VainlyC:VagaryD:Valley答案:Variety3、大数据分析四个方面的工作主要是:数据分类、()、关联规则挖掘和时间序列预测
A:数据统计B:数据计算C:数据聚类D:数据清洗答案:数据聚类4、新浪和京东联合推出的大数据商品推荐,是由京东盲目推送到当前浏览新浪网站的用户的页面上的
A:对B:错答案:错5、目前的大数据处理技术只能处理结构化数据
A:对B:错答案:错第二章1、我们常用的微软Office套件中的Access数据库软件的数据库文件格式后缀名是()
A:mdfB:mdbC:dbfD:xls答案:mdb2、大多数日志文件的后缀名是()
A:txtB:csvC:xmlD:log答案:log3、本课程重点介绍的weka软件的专有文件格式是()
A:MongoDBB:ARFFC:valueD:keymap答案:ARFF4、数据清洗工作的目的主要是要解决数据的完整性、唯一性、合法性和()
A:专业性B:排他性C:一致性D:共享性答案:一致性5、八爪鱼软件的“自定义采集”工作方式下,需要在软件里输入一个()来作为采集的目标
A:电话号码B:关键词C:网页地址D:用户名答案:网页地址6、八爪鱼软件的采集规则可以通过文件的形式来导入或者导出,这种文件的后缀名是()
A:otdB:jpgC:pngD:gif答案:otd7、Excel可以通过“数据有效性”按钮操作来规范数据输入的范围
A:对B:错答案:对8、Excel不能导入txt或csv格式的文件
A:对B:错答案:错9、八爪鱼软件只能对软