摘要: 这里我通过命令提示符来创建表 登陆数据库 进入spark_project数据库进行创建表,这里的脚本是我在文档里面写好的。 阅读全文
posted @ 2018-06-22 17:26 大数据和AI玩出的梗 阅读(109) 评论(0) 推荐(0) 编辑
摘要: 安装 使用 首先看到下面的界面 阅读全文
posted @ 2018-06-22 16:45 大数据和AI玩出的梗 阅读(122) 评论(0) 推荐(0) 编辑
摘要: mysql server 5.5的下载 下载地址: https://dev.mysql.com/downloads/mysql/5.0.html#linux mysql server 5.5的安装 双击 默认 next 这里需要一段时间 阅读全文
posted @ 2018-06-22 16:34 大数据和AI玩出的梗 阅读(164) 评论(0) 推荐(0) 编辑
摘要: 1、Sqoop是什么 Sqoop:SQL-to-Hadoop 传统数据库与Hadoop间数据同步工具 利用Mapreduce分布式批处理,加快了数据传输速度,保证了容错性 2、Sqoop1架构 sqoop import原理:从传统数据库获取元数据信息(schema、table、field、field 阅读全文
posted @ 2018-06-20 18:21 大数据和AI玩出的梗 阅读(891) 评论(0) 推荐(0) 编辑
摘要: 下载安装包:http://archive.apache.org/dist/sqoop/1.4.6/ 查看本机java版本 上传 查看 解压 查看 命名 删除 由于下载的是apache下面的 需要源码编译 找到hadoop版本 找到200 配置环境变量 进入配置文件 操作hadoop 配置环境变量 配 阅读全文
posted @ 2018-06-20 18:20 大数据和AI玩出的梗 阅读(130) 评论(0) 推荐(0) 编辑
摘要: Hive工作原理 流程大致步骤为: 1. 用户提交查询等任务给Driver。 2. 编译器获得该用户的任务Plan。 3. 编译器Compiler根据用户任务去MetaStore中获取需要的Hive的元数据信息。 4. 编译器Compiler得到元数据信息,对任务进行编译,先将HiveQL转换为抽象 阅读全文
posted @ 2018-06-20 18:08 大数据和AI玩出的梗 阅读(184) 评论(0) 推荐(0) 编辑
摘要: HBase的概念: HBase在生态圈位置 HBase与HDFS对比 HBase与关系型数据库的比较 HBase表的特点: 4)任意模式:每一行都有一个可排序的主键和任意多的列,列可以根据自己的需要动态的添加,同一张表中的不同的行他们的列可以不相同。 5)多个数据版本:每个单元中的数据可以有多个版本 阅读全文
posted @ 2018-06-20 11:39 大数据和AI玩出的梗 阅读(154) 评论(0) 推荐(0) 编辑
摘要: HBase HA分布式集群搭建部署———集群架构 搭建之前建议先学习好HBase基本构架原理:https://www.cnblogs.com/lyywj170403/p/9203012.html 集群部署: master:master slave1 regionservers :slave1 sla 阅读全文
posted @ 2018-06-20 10:21 大数据和AI玩出的梗 阅读(167) 评论(0) 推荐(0) 编辑
摘要: 对于初学者来说可以先使用免费的社区版本练练手。 ideaIC-2017.3.5——>社区版 ideaIU-2017.3.5——>旗舰版 一、IntelliJ IDEA(Community版本)下载 下载链接:https://www.jetbrains.com/idea/download/ 初学者可以 阅读全文
posted @ 2018-06-14 15:41 大数据和AI玩出的梗 阅读(9030) 评论(0) 推荐(0) 编辑
摘要: 一、下载 https://www.scala-lang.org/download/ 这里我选择Scala2.10.4版本 二、安装 安装比较简单 和jdk类似 点击一路安装: 选择自己的路径 完成 三、环境变量配置(和jdk类似) 找到path,在最后添加;%SCALA_HOME%\bin;%SCA 阅读全文
posted @ 2018-06-14 12:00 大数据和AI玩出的梗 阅读(352) 评论(0) 推荐(0) 编辑