摘要: 执行效果: 1. count(1) and count(*) 当表的数据量大些时,对表作分析之后,使用count(1)还要比使用count(*)用时多了! 从执行计划来看,count(1)和count(*)的效果是一样的。 但是在表做过分析之后,count(1)会比count(*)的用时少些(1w以 阅读全文
posted @ 2019-12-22 22:40 Xiaohu_BigData 阅读(6098) 评论(0) 推荐(0) 编辑
摘要: 在Sqoop导入或者导出,我们在查看mysql的时候会出现中文乱码大部分乱码会是?这样的问号,那么该怎么处理呢? 1、打开my.cnf文件 vim /etc/my.cnf 2、找到对应需要修改的地方 共3个地方,[client] [mysqld] [mysql]找到对应的位置,加入以下配置[mysq 阅读全文
posted @ 2019-12-22 19:35 Xiaohu_BigData 阅读(234) 评论(0) 推荐(0) 编辑
摘要: Hive架构流程(十分重要,结合图进行记忆理解)当客户端提交请求,它先提交到Driver,Driver拿到这个请求后,先把表明,字段名拿出来,去数据库进行元数据验证,也就是Metasore,如果有,返回有,Driver再返回给Complier编译器,进行HQL解析到MR任务的转化过程,执行完之后提交 阅读全文
posted @ 2019-12-22 19:26 Xiaohu_BigData 阅读(478) 评论(0) 推荐(0) 编辑
摘要: 我们之前导入的都是全量导入,一次性全部导入,但是实际开发并不是这样,例如web端进行用户注册,mysql就增加了一条数据,但是HDFS中的数据并没有进行更新,但是又再全部导入一次又完全没有必要。 所以,sqoop提供了增量导入的方法。 1、数据准备: 2、将其先用全量导入到HDFS中去 3、先在my 阅读全文
posted @ 2019-12-22 14:00 Xiaohu_BigData 阅读(501) 评论(0) 推荐(0) 编辑