摘要: 在现在的大数据时代,越来越多的企业开始使用Hadoop管理数据,但是现有的业务分析工具(如Tableau,Microstrategy等)往往存在很大的局限,如难以水平扩展、无法处理超大规模数据、缺少对Hadoop的支持;而利用Hadoop做数据分析依然存在诸多障碍,例如大多数分析师只习惯使用SQL, 阅读全文
posted @ 2017-08-23 17:32 柒君子 阅读(388) 评论(0) 推荐(0) 编辑
摘要: 脏数据是指源系统中的数据不在给定的范围内或对于实际业务毫无意义,或是数据格式非法,以及在源系统中存在不规范的编码和含糊的业务逻辑。 在数据库技术中,脏数据在临时更新(脏读)中产生。例如:事务A更新了某个数据项X,但是由于某种原因,事务A出现了问题,于是要把A回滚。但是在回滚之前,另一个事务B读取了数 阅读全文
posted @ 2017-08-23 17:10 柒君子 阅读(505) 评论(0) 推荐(0) 编辑