摘要: #1.外部表和内部表区别1. 创建表时:创建内部表时,会将数据移动到数据仓库指向的路径;若创建外部表,仅记录数据所在的路径, 不对数据的位置做任何改变。2. 删除表时:在删除表的时候,内部表的元数据和数据会被一起删除, 而外部表只删除元数据,不删除数据。这样外部表相对来说更加安全些,数据组织也更加灵活,方便共享源数据。 3. hive默认创建的是内部表4. 外部表比内部表更加安全5. 在删除内部表... 阅读全文
posted @ 2017-07-15 23:41 刘耀 阅读(1333) 评论(0) 推荐(0) 编辑
摘要: #1.ThiftServer介绍1. 正常的hive仅允许使用HiveQL执行查询、更新等操作,并且该方式比较笨拙单一。幸好Hive提供了轻客户端的实现,通过HiveServer或者HiveServer2,客户端可以在不启动CLI的情况下对Hive中的数据进行操作,两者都允许远程客户端使用多种编程语言如Java、Python向Hive提交请求,取回结果 使用jdbc协议连接hive的thrifts... 阅读全文
posted @ 2017-07-15 23:07 刘耀 阅读(7899) 评论(0) 推荐(0) 编辑
摘要: #1.hive的增删改查 1. 查询数据库 ``` hive> show databases; OK default Time taken: 0.254 seconds, Fetched: 1 row(s) hive> #defalut是默认数据库 ```2. 创建数据库 ``` hi... 阅读全文
posted @ 2017-07-15 21:30 刘耀 阅读(1553) 评论(0) 推荐(0) 编辑
摘要: #1.Hive介绍1. 数据库OLTP 在线事务处理2. 数据仓库OLAP 在线分析处理 延迟高3. 类sql方式(HQL)4. 使用sql方式,用来读写,管理位于分布式存储系统上的大型数据集的数据仓库技术5. hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供完整的sql查询功能,可以将sql语句转换为MapReduce任务进行运行。其优点是学习成本低... 阅读全文
posted @ 2017-07-15 21:17 刘耀 阅读(508) 评论(0) 推荐(0) 编辑