《大数据导论》简答题与答案1.人类社会的数据产生方式经历了哪些阶段?简述各阶段的特点。人类历史上从未有哪个时代和今天一样产生如此海量的数据,人类社会的数据产生方式大致经历了 3 个阶段:运营式系统、用户原创内容阶段、感知式系统阶段。(1)运营式系统:数据库的出现使得数据管理的复杂度大大降低,实际中数据库大都为运营系统所采用,作为运营系统的数据管理子系统,如超市的销售记录系统、银行的交易记录系统、医院病人的医疗记录等。人类社会数据量第一次大的飞跃正是建立在运营式系统广泛使用数据库开始,这些数据规范、有秩序、强调数据的一致性,且这些数据的产生方式是被动的。(2)用户原创内容阶段:互联网的诞生促使人类社会数据量出现第二次大的飞跃,但真正的数据爆发产生于 Web2.0 时代,其重要标志就是用户原创内容。以博客、微博为代表的新型社交网络的出现和快速发展,使得用户产生数据的意愿更加强烈;新型移动设备出现,易携带、全天候接入网络的移动设备使得人员在网上发现自己意见的途径更为便捷数据结构复杂,无秩序,不强调数据的一致性或只强调弱一致性,这些数据的产生方式是主动的。(3)感知式系统:人类社会数据量第三次大的飞跃最终导致了大数据的产生,这次飞跃的根本原因在于感知式系统的广泛使用。微小带着处理功能的传感器设备广泛布置于社会的各个角落,通过这些设备对整个社会的运转进行监控,这些设备会源源不断地产生新数据,这些数据的产生方式是自动的,数据呈现多源异构、分布广泛、动态演化等。简单来说,数据产生经历了被动、主动和自动三个阶段,这些被动、主动和自动的数据共同构成了大数据的数据来源。2. 大数据处理的关键技术都有哪些?并做简要描述。大数据处理的关键技术主要包括:数据采集和预处理、数据存储、数据计算处理、数据分析和挖掘、数据可视化展示等。1) .数据采集,又称数据获取,是大数据生命周期的第一个环节,通过 RFID 射频识别技术、传感器、交互型社交网络以及移动互联网等方式获得的各种类型的结构化、半结构化及非结构化的海量数据。2) .数据预处理是数据分析和挖掘的基础,是将接收数据进行抽取、清洗、转换、归约等并最终加载到数据存储的过程。3) .数据存储,需要将采集到的数据进行存储管理,建立相应的数据库。4) .数据计算处理。单台计算机必然无法完成海量的数据处理工作,需要分布式架构的计算平台。5).数据分析与挖掘,是基于商业目的,有...