大数据分析与挖掘智慧树知到课后章节答案2023年下青岛黄海学院青岛黄海学院第一章测试1.下列选项中,用于搭建数据仓库和保证数据质量的是()。A:数据展现B:数据分析C:数据收集D:数据处理答案:数据处理2.HTML文档属于()。A:不是数据B:结构化数据C:非结构化数据D:半结构化数据答案:半结构化数据3.数据挖掘的英文缩写()。A:DMB:DAC:DCD:DB答案:DM4.Hadoop的基础架构是()。A:ABC都不正确B:分布式系统C:操作系统D:同步系统答案:分布式系统5.一般情况下,计算机处理的数据都是()。A:无结构化的数据B:非结构化的数据C:半结构化的数据D:结构化的数据答案:结构化的数据第二章测试1.在Python中实现多个条件判断需要用到与if语句的组合语句是()A:ABC均不是B:elifC:passD:else答案:elif2.Python语言属于以下哪种语言()A:机器语言B:ABC都不正确C:高级语言D:汇编语言答案:高级语言3.下列选项中,不是Python关键字的是()A:staticB:passC:yieldD:from答案:static第三章测试1.已知x=np.array((1,2,3,4,5)),那么表达(x**2).max()的值为()。A:20B:25C:15D:30答案:252.已知x=np.array((1,2,3,4,5)),那么表达式(x//5).sum()的值()。A:2B:3C:4D:1答案:13.已知x=np.array((1,2,3),4,5),那么表达式sum(x*x)的值()。A:50B:55C:60D:65答案:554.在Matplotlib中,用于绘制散点图的函数是()。A:pie()B:scatter()C:bar()D:hist()答案:scatter()5.下列选项中,不属于Seaborn库特点的是()A:多个内置主题及颜色主题B:基于网格绘制出更加复杂的图像集合C:可以处理大量的数据流D:Seaborn是基于Matplotlib的可视化库答案:可以处理大量的数据流第四章测试1.下列不属于HTTP请求过程的是()A:请求重定向B:超时设置C:搜索文档D:生成请求答案:搜索文档2.下列关于Python爬虫库的功能,描述不正确的是()A:通用爬虫库——urllibB:Html/Xml解析器——pycurlC:爬虫库——ScrapyD:通用爬虫库——requests答案:Html/Xml解析器——pycurl3.下列对于Scrapy常用命令及其作用描述错误的是()A:list是一个全局命令,主要用于列出项目中所有可用的爬虫B:startproject是一个全局命令,主要用于运行一个独立的爬虫C:crawl是一个项目命令,主要用于启动爬虫D:genspider是一个项目命令,主要用于创建爬虫模板答案:startproject是一个全局命令,主要用于运行一个独立的爬虫4.下列请求头中,可以记载用户信息实现模拟登录的是()A:ConnectionB:User-AgentC:CookieD:Host答案:Cookie5.下列不属于Scrapy框架的基本组成部分的是()A:下载器与SpidersB:引擎与调度器C:ItemPipelnesD:解析中间件答案:引擎与调度器第五章测试1.下列关于Pandas数据读/写说法错误的是()A:to_csv函数能够读取数据库的数据写入.csv文件B:read_csv能够读取所有文本文档的数据C:to_excel函数能够将结构化数据写入Excel文件D:read_sql能够读取数据库的数据答案:read_csv能够读取所有文本文档的数据2.下列关于时间相关类错误的是()A:Timestamp是存放某个时间点的类B:两个数值上相同的Period和Timestamp所代表的意义相同C:Period是存放某个时间段的类D:Timestamp数据可以使用标准的试卷字符串转换得来答案:两个数值上相同的Period和Timestamp所代表的意义相同3.使用pivot_table函数制作透视表设置行分组键的参数为()。A:indexB:dataC:valuesD:raw答案:index4.使用其本身可以达到数据透视功能的函数是()。A:pivot_tableB:transformC:groupbyD:crosstab答案:pivot_table5.下列关于groupby方法说法确的是()A:proupby方法的结果能够直接查看B:groupby能够实现分组聚C:groupby是pandas提供的一个用来分组的方法D:groupby方法是pandas提供的一个用来聚合的方法答案:groupby是pandas提供的一个用来分组的方法第六章测试1.下列关于sklearn说法错误的是()。A:sklearn在官网被分为7个大块B:sklearn需要NumPy和SciPy库的支持C:sklearm全称为scikitlearnD:sklearm的聚类算法几乎都已经放在cluster模块中了答案:sklearn在官网被分为7个大块2.下列关于train_test_split丽数的说法正确的是()。A:train_test_split能够将数据集划分为训练集、...