大数据测试步骤

大数据测试实现被分成三个步。
  Step 1:数据阶段验证
  大数据测试的第一步,也称作pre-hadoop阶段该过程包括如下验证:
  ·  来自各方面的数据资源应该被验证,来确保正确的数据被加载进系统
  ·  将源数据与推送到Hadoop系统中的数据进行比较,以确保它们匹配
  ·  验证正确的数据被提取并被加载到HDFS正确的位置
  该阶段可以使用工具Talend或Datameer,进行数据阶段验证。
  Step 2:"MapReduce"验证
  大数据测试的第二步是MapReduce的验证。在这个阶段,测试者在每个节点上进行业务逻辑验证,然后在运行多个节点后验证它们,确保如下操作的正确性:
  ·  Map与Reduce进程正常工作
  ·  在数据上实施数据聚合或隔离规则
  ·  生成键值对
  ·  在执行Map和Reduce进程后验证数据
  Step 3:输出阶段验证
  大数据测试的最后或第三阶段是输出验证过程。生成输出数据文件,同时把文件移到一个EDW(Enterprise Data Warehouse:企业数据仓库)中或着把文件移动到任何其他基于需求的系统中。在第三阶段的活动包括:
  ·  检查转换(Transformation)规则被正确应用
  ·  检查数据完整性和成功的数据加载到目标系统中
  ·  通过将目标数据与HDFS文件系统数据进行比较来检查没有数据损坏

posted @ 2019-01-14 15:24  飞鹰怪侠  阅读(627)  评论(0编辑  收藏  举报