上一页 1 ··· 3 4 5 6 7 8 9 10 下一页
摘要: 大的归类三个方面: 一 数据质量 1 数据的完整性: 所有的所都符合BI业务需求。 2 数据的一致性: 经过数据清洗转化(ETL)能和数据源保持一致。 3 数据的精准性: 在不同的业务规则和业务情景下,值都是正确的。 二 数据性能:数据仓库能够给用户报表和不用的query提供好的性能 三 数据安全行 阅读全文
posted @ 2018-03-21 13:09 Jesse_Li 阅读(2658) 评论(0) 推荐(0) 编辑
摘要: 下图是演示了Combiner的好处 因为我们知道Hadoop的好处在于集群中有很多小的机器,组成了一个庞大的集群,把一个大的计算任务后者说复杂的计算过程分发到了一个个小的机器上面。但是这个集群一个致命或者是不好的就是大部分会花在磁盘IO上面,如果我们把这部分时间节省了,也就加快了MR的速度,因为Ma 阅读全文
posted @ 2018-03-17 18:06 Jesse_Li 阅读(165) 评论(0) 推荐(0) 编辑
摘要: MapReduce的整个运行分为两个阶段: Map和Reduce Map阶段由一定数量的Map Task组成 输入格式的数据格式化:InputFormat 数日数据的处理:Mapper 数据分组:Partitioner 下面流程图: 1. Map task 首先从HDFS上Read文件,通过Inpu 阅读全文
posted @ 2018-03-17 17:42 Jesse_Li 阅读(164) 评论(0) 推荐(0) 编辑
摘要: 环境:Python 3.6 原因是 Python 3 中没有next(), 而是__next__(self) 代替 阅读全文
posted @ 2018-03-08 18:15 Jesse_Li 阅读(554) 评论(0) 推荐(0) 编辑
摘要: 环境:Python 3.6 File "<ipython-input-20-ac8d4b51998e>", line 2 print "%s\t%s"%(word,"1") ^ SyntaxError: invalid syntax Root Case: Python3 语法错误,print后要跟( 阅读全文
posted @ 2018-03-07 13:59 Jesse_Li 阅读(1753) 评论(0) 推荐(0) 编辑
摘要: 1. 找到python文件目录, 用管理员身份打开powershell python -m pip install jupyter 2. Jupyter notebook 阅读全文
posted @ 2018-03-06 18:04 Jesse_Li 阅读(182) 评论(0) 推荐(0) 编辑
摘要: 最近在研究log4j。在Log4j官网下载了tar.gz.文件。解压时候出现错误。 1. wget https://www.apache.org/dyn/closer.lua/logging/log4j/2.10.0/apache-log4j-2.10.0-bin.tar.gz. 很顺利压缩包下载了 阅读全文
posted @ 2018-02-13 11:21 Jesse_Li 阅读(1369) 评论(0) 推荐(0) 编辑
摘要: schematool -initSchema -dbType mysqlMetastore connection URL: jdbc:mysql://localhost/metastore_db?createDatabaseIfNotExist=trueMetastore Connection Dr 阅读全文
posted @ 2017-11-29 10:54 Jesse_Li 阅读(5174) 评论(3) 推荐(2) 编辑
摘要: Hive 遇到 Class path contains multiple SLF4J bindings Root Issue; slf4j在两处找到了jar包。分别是在Hadoop和hive的安装目录。 删除一个就好。 阅读全文
posted @ 2017-11-09 15:09 Jesse_Li 阅读(5644) 评论(0) 推荐(1) 编辑
摘要: hadoop 单节点安装成功了之后,心情那是叫一个激动。不过后来不知道为什么系统相当的慢。于是就把系统重启了。但是不妙的是namenode各种无法启动。 原来的配置: core-site.xml hdfs-site.xml 网上搜了一圈原来是由于虚拟机的原来hdfs会自动创建自己的namenode和 阅读全文
posted @ 2017-11-09 14:36 Jesse_Li 阅读(407) 评论(0) 推荐(0) 编辑
上一页 1 ··· 3 4 5 6 7 8 9 10 下一页