上一页 1 ··· 8 9 10 11 12 13 14 15 16 ··· 19 下一页
摘要: 执行效果: 1. count(1) and count(*) 当表的数据量大些时,对表作分析之后,使用count(1)还要比使用count(*)用时多了! 从执行计划来看,count(1)和count(*)的效果是一样的。 但是在表做过分析之后,count(1)会比count(*)的用时少些(1w以 阅读全文
posted @ 2019-12-22 22:40 Xiaohu_BigData 阅读(6098) 评论(0) 推荐(0) 编辑
摘要: 在Sqoop导入或者导出,我们在查看mysql的时候会出现中文乱码大部分乱码会是?这样的问号,那么该怎么处理呢? 1、打开my.cnf文件 vim /etc/my.cnf 2、找到对应需要修改的地方 共3个地方,[client] [mysqld] [mysql]找到对应的位置,加入以下配置[mysq 阅读全文
posted @ 2019-12-22 19:35 Xiaohu_BigData 阅读(234) 评论(0) 推荐(0) 编辑
摘要: Hive架构流程(十分重要,结合图进行记忆理解)当客户端提交请求,它先提交到Driver,Driver拿到这个请求后,先把表明,字段名拿出来,去数据库进行元数据验证,也就是Metasore,如果有,返回有,Driver再返回给Complier编译器,进行HQL解析到MR任务的转化过程,执行完之后提交 阅读全文
posted @ 2019-12-22 19:26 Xiaohu_BigData 阅读(478) 评论(0) 推荐(0) 编辑
摘要: 我们之前导入的都是全量导入,一次性全部导入,但是实际开发并不是这样,例如web端进行用户注册,mysql就增加了一条数据,但是HDFS中的数据并没有进行更新,但是又再全部导入一次又完全没有必要。 所以,sqoop提供了增量导入的方法。 1、数据准备: 2、将其先用全量导入到HDFS中去 3、先在my 阅读全文
posted @ 2019-12-22 14:00 Xiaohu_BigData 阅读(501) 评论(0) 推荐(0) 编辑
摘要: 问题一: 在上传过程中遇到这种问题: ERROR tool.ExportTool: Encountered IOException running export job: java.io.IOException: No columns to generate for ClassWriter 解决方式 阅读全文
posted @ 2019-12-21 21:50 Xiaohu_BigData 阅读(729) 评论(0) 推荐(0) 编辑
摘要: Sqoop的使用一(将数据库中的表数据上传到HDFS) 首先我们先准备数据 1、没有主键的数据(下面介绍有主键和没有主键的使用区别) -- MySQL dump 10.13 Distrib 5.1.73, for redhat-linux-gnu (x86_64) -- -- Host: local 阅读全文
posted @ 2019-12-21 21:35 Xiaohu_BigData 阅读(476) 评论(0) 推荐(0) 编辑
摘要: Sqoop 的安装配置比较简单。 提供安装需要的安装包和连接mysql的驱动的百度云链接: 链接:https://pan.baidu.com/s/1pdFj0u2lZVFasgoSyhz-yQ 提取码:62vt 1、下载后将两个都拖到自己安装Hive的节点上去,因为我们后面配置文件中会去配置这些,在 阅读全文
posted @ 2019-12-21 21:18 Xiaohu_BigData 阅读(260) 评论(0) 推荐(0) 编辑
摘要: 为了方便后面的学习,在学习Hive的过程中先学习一个工具,那就是Sqoop,你会往后机会发现sqoop是我们在学习大数据框架的最简单的框架了。 Sqoop是一个用来将Hadoop和关系型数据库中的数据相互转移的工具,可以将一个关系型数据库(例如 : MySQL ,Oracle ,Postgres等) 阅读全文
posted @ 2019-12-21 21:05 Xiaohu_BigData 阅读(481) 评论(0) 推荐(0) 编辑
摘要: 在之前博客中我有记录安装JDK和Hadoop和Mysql的过程,如果还没有安装,请先进行安装配置好,对应的随笔我也提供了百度云下载连接。 安装JDK: https://www.cnblogs.com/wyh-study/p/12014368.html 安装Hadoop https://www.cnb 阅读全文
posted @ 2019-12-20 20:20 Xiaohu_BigData 阅读(709) 评论(0) 推荐(0) 编辑
摘要: 什么是Hive? 我来一个短而精悍的总结(面试常问) 1:hive是基于hadoop的数据仓库建模工具之一(后面还有TEZ,Spark)。 2:hive可以使用类sql方言,对存储在hdfs上的数据进行分析和管理。 Hive 是建立在 Hadoop 上的数据仓库基础构架。它提供了一系列的工具,可以用 阅读全文
posted @ 2019-12-20 19:46 Xiaohu_BigData 阅读(1187) 评论(0) 推荐(0) 编辑
上一页 1 ··· 8 9 10 11 12 13 14 15 16 ··· 19 下一页