摘要: 什么是Hive? Hive:由Facebook开源用于解决海量结构化日志的数据统计工具。 Hive 是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张表,并提供类SQL查询功能。 本质是:将SQL转化成MapReduce程序。 1、Hive 处理的数据存储在HDFS; 2、Hiv 阅读全文
posted @ 2020-11-28 19:39 sycl 阅读(402) 评论(0) 推荐(0) 编辑
摘要: 查找系统自带函数: show functions; 排序: ORDER BY : 全局排序,只有一个reducer, ASC(ascend)升序(默认); DESC(descend)降序 SORT BY : 每个MapReduce内部排序 对于大规模的数据集 order by 的效率非常低,在很多情 阅读全文
posted @ 2020-11-25 20:36 sycl 阅读(118) 评论(0) 推荐(0) 编辑
摘要: 概念:Java DataBase Connectivity Java 数据库连接 具体步骤: 1. 导入驱动jar包 mysql-connector-java-5.1.37-bin.jar: 1.复制mysql-connector-java-5.1.37-bin.jar到项目的libs目录下 2.右 阅读全文
posted @ 2020-10-26 20:10 sycl 阅读(67) 评论(0) 推荐(0) 编辑
摘要: 索引: 索引的目的在于提高查询效率 本质都是通过不断地缩小想要获取数据的范围来筛选出最终想要的结果,同时把随机的事件变成顺序的事件,也就是说,有了这种索引机制,我们可以总是用同一种查找方式来锁定数据 磁盘读取: 磁盘读取数据靠的是机械运动,每次读取数据花费的时间可以分为寻道时间,旋转延迟,传输时间三 阅读全文
posted @ 2020-10-23 20:43 sycl 阅读(64) 评论(0) 推荐(0) 编辑
摘要: 查询的基本语法: SELECT 列1…… FROM 表名WHERE 表达式GROUP BY 表达式HAVING 表达式ORDER BY 表达式LIMIT 起始编号,查询条数 where型子查询: IN:等于任何一个 。例: a=IN( c , d )等价于a=c or a=d ALL:和子查询返回的 阅读全文
posted @ 2020-10-22 21:22 sycl 阅读(78) 评论(0) 推荐(0) 编辑
摘要: select的5个子句: where条件查询 group by分组查询 having筛选 order by排序 limit分页 where型子查询: where型子查询即把内层sql语句查询的结果作为外层sql查询的条件. 子查询要在括号内 建议将子查询放在比较条件右侧 单行操作符:子查询必须返回单 阅读全文
posted @ 2020-10-21 20:42 sycl 阅读(61) 评论(0) 推荐(0) 编辑
摘要: 注意:mysql数据支持事务,但是要求必须是innoDB存储引擎 GRANT:授予访问权限 REVOKE:撤销访问权限 COMMIT:提交事务处理 ROLLBACK:事务处理回退 SAVEPOINT:设置保存点 LOCK:对数据库的特定部分进行锁定 start transaction / begin 阅读全文
posted @ 2020-10-21 20:32 sycl 阅读(141) 评论(0) 推荐(0) 编辑
摘要: 表字段的增,删,改,查: 增:alter table 表名 add 字段名 数据类型 【位置】 删:alter table 表名 drop 字段名; 改:alter table 表名 modify 字段名 数据类型 【位置】; 重命名: alter table 表名 change oldname n 阅读全文
posted @ 2020-10-20 20:55 sycl 阅读(1428) 评论(0) 推荐(0) 编辑