1/9大数据测试方法和工具梳理1什么是大数据大数据是一个大的数据集合,通过传统的计算技术无法进行处理
这些数据集的测试需要使用各种工具、技术和框架进行处理
大数据涉及数据创建、存储、检索、分析,而且它在数量、多样性、速度方法都很出色
2大数据测试类型测试大数据应用程序更多的是验证其数据处理,而不是测试软件产品的个别功能
当涉及到大数据测试时,性能和功能测试是关键
在大数据测试中,QA工程师使用集群和其他组件来验证对TB级数据的成功处理
因为处理非常快,所以它需要高水平的测试技能
处理可以是三种类型:批量、实时、交互
与此同时,数据质量也是大数据测试的一个重要因素
在测试应用程序之前,有必要检查数据的质量,并将其视为数据库测试的一部分
它涉及检查各种字段,如一致性,准确性,重复,一致性,有效性,数据完整性等
3大数据测试实现被分成三个步3
1步骤1:数据分段验证大数据测试的第一步,也称为pre-Hadoop阶段涉及过程验证
来自各种来源(如RDBMS,博客,社交媒体等)的数据应进行验证,以确保正确的数据被拉入系统2/9将源数据与推送到Hadoop系统中的数据进行比较,以确保它们匹配验证正确的数据被提取并加载到正确的HDFS位置该阶段可以使用工具Talend或Datameer,进行数据阶段验证
2步骤2:“MapReduce”验证大数据测试的第二步是MapReduce的验证
在这个阶段,测试者在每个节点上进行业务逻辑验证,然后在运行多个节点后验证它们,确保如下操作的正确性:MapReduce进程正常工作在数据上实现数据聚合或隔离规则生成键值对在MapReduce进程后验证数据3
3步骤3:输出验证阶段大数据测试的最后或第三阶段是输出验证过程
生成输出数据文件,同时把文件移到一个EDW(EnterpriseDataWarehouse:企业数据仓库)中或着把文件移动到任何其他基