上一页 1 2 3 4 5 6 7 8 ··· 10 下一页
摘要: HAVING子句用于过滤分组,它与WHERE子句的作用类似,但WHERE作用于行,HAVING作用于分组。 HAVING子句的基本语法为: SELECT column1, aggregate_function(column2) FROM table_name GROUP BY column1 HAV 阅读全文
posted @ 2023-07-14 15:57 BBBone 阅读(203) 评论(0) 推荐(0) 编辑
摘要: DDL(Data Definition Language)是Oracle数据库的数据库定义语言,用于定义数据库对象。它允许用户创建、修改或删除数据库对象,如表、视图、索引、触发器、存储过程等。 DDL语句的主要类型有: 1. CREATE:用于创建数据库对象,如表、视图、索引、序列、存储过程等。 C 阅读全文
posted @ 2023-07-14 15:50 BBBone 阅读(43) 评论(0) 推荐(0) 编辑
摘要: DCL(Data Control Language)是Oracle数据库的数据控制语言,用于授权和撤销数据库对象的访问权限,以及控制数据库的事务处理。 DCL的主要语句有: 1. GRANT:用于授予对象权限,如SELECT、INSERT、UPDATE、DELETE等权限。语法: GRANT pri 阅读全文
posted @ 2023-07-14 15:50 BBBone 阅读(291) 评论(0) 推荐(0) 编辑
摘要: CASE表达式是SQL中的条件选择语句,用于根据条件选择相应的结果。它类似于其他编程语言中的switch-case语句。 CASE表达式的基本语法有两种: 1. 条件THEN结果: CASE WHEN condition1 THEN result1 WHEN condition2 THEN resu 阅读全文
posted @ 2023-07-14 15:50 BBBone 阅读(51) 评论(0) 推荐(0) 编辑
摘要: 一、cache和persisit的对比-rw-r--r--@ 1 hadoop staff 68M 5 17 07:04 access.logcache/persitence是 lazy的,延迟加载unpersitence是立即执行的@DeveloperApiclass StorageLevel private( private var _useDisk: Boolean, ... 阅读全文
posted @ 2019-06-27 15:35 BBBone 阅读(409) 评论(0) 推荐(0) 编辑
摘要: https://github.com/xingsuio/scalaPra 阅读全文
posted @ 2019-06-27 15:17 BBBone 阅读(117) 评论(0) 推荐(0) 编辑
摘要: 静态分区:手动指定分区加载数据,就是常说的静态分区的使用。但是在日常工作中用的比较多的是动态分区。 创建:hive> create table order_mulit_partition( > order_number string, > event_time string > ) > PARTITIONED BY(event_month string, step str... 阅读全文
posted @ 2019-06-24 19:01 BBBone 阅读(498) 评论(0) 推荐(0) 编辑
摘要: RDD five main propertiesMethodLocationInputOutputA list of partitionsgetPartitions?-[Partition]A function for computing each splitcompute?PartitionIterableA list of dependencies on other RDDgetDepend... 阅读全文
posted @ 2019-06-24 11:02 BBBone 阅读(199) 评论(0) 推荐(0) 编辑
摘要: hadoop001: zk rm(zkfc线程) nmhadoop002: zk rm(zkfc线程) nmhadoop003: zk nmRMStateStore: 存储在ZK的/rmstore目录下ZKFC仅仅是线程大数据的数据是不能丢的,但是作业是可以挂的,挂了重启即可.因此YARN的架构比较轻量级,HDFS的架构相对来说,比较重量级别.小结:当我们RM进程启动... 阅读全文
posted @ 2019-06-24 11:00 BBBone 阅读(893) 评论(0) 推荐(0) 编辑
摘要: 为什么要用集群?企业里面,多台机器 伪分布式 每一个角色都是一个进程HDFS:NNSNNDNYARN:RMNM大数据所有组件, 都是主从架构 master-slaveHDFS读写请求都是先到NN节点,但是,HBase 读写请求不是经过master, 建表和删除表是需要经过masterNN节点挂了,就不能提供对外服务 (-put,-get)需要配置两个NN节点(实时的,任何时刻只有一台active... 阅读全文
posted @ 2019-06-24 10:59 BBBone 阅读(320) 评论(0) 推荐(0) 编辑
上一页 1 2 3 4 5 6 7 8 ··· 10 下一页