电脑桌面
添加小米粒文库到电脑桌面
安装后可以在桌面快捷访问

南开大学20秋学期《大数据导论》在线作业(参考答案) VIP免费

南开大学20秋学期《大数据导论》在线作业(参考答案) _第1页
1/22
南开大学20秋学期《大数据导论》在线作业(参考答案) _第2页
2/22
1.大数据的特点不包含()。A.数据体量大B.价值密度高C.处理速度快D.数据不统一答案:D2.大数据的最显著特征是()。A.数据规模大B.数据类型多样C.数据处理速度快D.数据价值密度高答案:A3.数据产生方式变革中数据产生方式是自动的主要是来自哪个阶段?()A.运营式系统阶段B.用户原创内容阶段C.感知式系统阶段答案:C4.下列哪个工具常用来开发移动友好地交互地图?()A.LeafletB.Visual.lyC.BPizzaPieChartsD.Gephi答案:A5.医疗健康数据的基本情况不包括以下哪项?()A.诊疗数据B.个人健康管理数据C.公共安全数据D.健康档案数据答案:C6.数据仓库是随着时间变化的,下列不正确的是()。A.数据仓库随时间变化不断增加新内容B.捕捉到的新数据会覆盖原来的快照C.数据仓库随事件变化不断删去旧的数据内容D.数据仓库中包含大量的综合数据,这些综合数据会随时间的变化不断进行重新综合答案:C7.IaaS是()的简称。A.软件即服务B.平台即服务C.基础设施即服务D.硬件即服务答案:C8.哪个选项不属于大数据4V特点?()A.VolumeB.ValidC.VarietyD.Value答案:B9.第一个提出大数据概念的公司是()。A.麦肯锡公司B.谷歌公司C.微软公司D.脸谱公司答案:A10.MapReduce中的Map和Reduce函数使用()进行输入输出。A.key/value对B.随机数值C.其他计算结果答案:A11.数据清洗的方法不包括()。A.缺失值处理B.噪声数据清除C.一致性检查D.重复数据记录处理答案:D12.以下不是数据仓库基本特征的是()。A.数据仓库是面向主题的B.数据仓库是面向事务的C.数据仓库的数据是相对稳定的D.数据仓库的数据是反映历史变化的答案:B13.下列不属于Google云计算平台技术架构的是()。A.并行数据处理MapReduceB.分布式锁ChubbyC.结构化数据表BigTableD.弹性云计算EC2答案:D14.下列哪个R语言扩展包可以创建带有点和边的网络图?()A.ggplot2B.networkC.ggmapsD.animation答案:B15.基础设施即服务的英文简称是()。A.IaaSB.PaaSC.SaaS答案:A16.大数据时代预测人类移动行为的数据特点是()。A.多样化B.数据量大C.维数高D.变化快答案:BCD17.借助于大数据提供的()和(),政府可为农业生产进行合理引导,依据需求进行生产,避免产能过剩造成不必要的资源和社会财富浪费。A.消费能力B.趋势报告C.购物结果答案:AB18.关于R语言扩展包下列正确的是()。A.network可创建带有点和边的网络图B.animation可制作一系列的图像并将它们串联起来做成动画C.ggmaps通过树图来可视化层次型数据D.protfolio基于谷歌地图、OpenStreetMap及其他地图的空间数据可视化工具答案:AB19.网络数据采集常用的是通过()或()等方式从网站上获取数据信息。A.网络爬虫B.网站公开APIC.手动获取答案:AB20.数据分析的类型根据数据分析深度可以分为()。A.描述性分析B.预测性分析sC.规则性分析答案:ABC21.数据变换(DataTransformation)的方法有()。A.光滑B.聚集C.数据泛化D.规范化答案:ABCD22.按照数据量的大小,可将数据分析分为()。A.内存级数据分析B.Bl级数据分析C.海量级数据分析D.巨量级数据分析答案:ABC23.可使用(),(),()进行光滑。A.最大值B.箱中位数C.箱边界D.箱均值答案:BCD24.常见的分类方法有()。A.决策树B.贝叶斯网络C.遗传算法D.FP算法答案:ABC25.医疗大数据特点:除了包含了大数据4个“V”的特点之外还有()。A.多态性B.时效性C.不完整性D.冗余性答案:ABCD26.大数据在医疗中的应用有()。A.流行性疾病预防B.慢性病健康管理C.临床决策支持D.医疗器械研发答案:ABCD27.一个HDFS集群由一个()和()构成。此外,还有与这两个角色之间作为沟通桥梁的客户端(Client)。A.一个名字节点B.若干个名字节点C.一个数据节点D.若干个数据节点答案:AD28.主流分布式计算平台有()。A.googleB.IBMC.baiduD.Amazon答案:ABD29.大数据存储的特点与挑战有()。A.容量问题B.延迟问题C.安全问题D.成本问题答案:ABCD30.百度大数据引擎主要包含()三大组件。A.开放云B.数据工厂C.百度大脑。答案:ABC31.减少已分配但未使用的存储容量的浪费,在分配存储空间时,系统按需分配存储空间。()A.正确B.错误答案:A32.广播变量在广播后可以修改。()A.正确B.错误答案:B33.内存级分析适用于总数据量在...

1、当您付费下载文档后,您只拥有了使用权限,并不意味着购买了版权,文档只能用于自身使用,不得用于其他商业用途(如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利)。
2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。
3、如文档内容存在违规,或者侵犯商业秘密、侵犯著作权等,请点击“违规举报”。

碎片内容

南开大学20秋学期《大数据导论》在线作业(参考答案)

您可能关注的文档

确认删除?
VIP
微信客服
  • 扫码咨询
会员Q群
  • 会员专属群点击这里加入QQ群
客服邮箱
回到顶部