摘要: 聚集索引与非聚集索引 参考链接: http://blog.sina.com.cn/s/blog_d13b2a8f0102wlj8.html http://jingyan.baidu.com/article/e73e26c0f1e82d24acb6a75d.html http://www.cnblog 阅读全文
posted @ 2017-03-24 16:13 跳出 阅读(679) 评论(0) 推荐(0) 编辑
摘要: 一、不同索引 1.1索引介绍 索引分单列索引和组合索引。单列索引,即一个索引只包含单个列,一个表可以有多个单列索引,但这不是组合索引。组合索引,即一个索包含多个列。创建索引时,你需要确保该索引是应用在SQL 查询语句的条件(一般作为WHERE 子句的条件)。实际上,索引也是一张表,该表保存了主键与索 阅读全文
posted @ 2017-03-24 15:11 跳出 阅读(248) 评论(0) 推荐(0) 编辑
摘要: Hive四种数据导入方式: 1) 从本地文件系统中导入数据到hive表; hive>load data local inpath 'mytable.txt' into table mytabl; 注意:和我们熟悉的关系型数据库不一样,Hive现在还不支持在insert语句里面直接给出一组记录的文字形 阅读全文
posted @ 2017-03-24 10:53 跳出 阅读(682) 评论(0) 推荐(0) 编辑
摘要: 1、创建表: hive>create table pokes(foo int,bar string); hive>create table new_tb like pokes; 创建一个一样的表结构 2、创建分区表: Hive>create table logs(ts bigint,line str 阅读全文
posted @ 2017-03-24 10:24 跳出 阅读(854) 评论(0) 推荐(0) 编辑
摘要: (1)Hive数据库 类似传统数据库的DataBase,在第三方数据库里实际是一张表。简单示例命令行 : hive > create database test_database (2)内部表 Hive的内部表与数据库中的Table在概念上是类似。每一个Table在Hive中都有一个相应的目录存储数 阅读全文
posted @ 2017-03-24 10:21 跳出 阅读(379) 评论(0) 推荐(0) 编辑
摘要: Roekey设计原则: 1)Rowkey的长度原则: 是一个二进制码流,Rowkey 的长度被很多开发者建议说设计在10~100 个字节,不过建议是越短越好,不要超过16 个字节。 2)Rowkey散列原则:如果Rowkey 是按时间戳的方式递增,不要将时间放在二进制码的前面,建议将Rowkey的高 阅读全文
posted @ 2017-03-24 09:54 跳出 阅读(3885) 评论(0) 推荐(0) 编辑