上一页 1 ··· 5 6 7 8 9 10 11 12 13 ··· 19 下一页
摘要: 列表,元组 查 索引(下标) ,都是从0开始 切片 .count 查某个元素的出现次数 .index 根据内容找其对应的位置 "haidilao ge" in a 增加 a.append() 追加 a.insert(index, "内容") a.extend 扩展 修改 a[index] = "新的 阅读全文
posted @ 2017-11-10 12:14 RZ_Lee 阅读(171) 评论(0) 推荐(0) 编辑
摘要: Spark里面提供了一个比较重要的抽象——弹性分布式数据集(resilient distributed dataset),简称RDD。弹性:数据可大可小,可分布在内存或磁盘,当某台机器宕机时,能够按照RDD的liveage重新计算,从而恢复。 RDD有5个特性: 1.一个分区列表,用于并行计算,每个 阅读全文
posted @ 2017-11-10 01:02 RZ_Lee 阅读(265) 评论(0) 推荐(0) 编辑
摘要: Kafka是一个高吞吐量的分布式消息系统,一个分布式的发布-订阅消息系统。Kafka是一种快速,可拓展的,设计内在就是分布式的,分区的可复制的提交日志服务。 Apache Kafka与传统消息系统相比,有以下不同: 它设计为一个分布式系统,易于向外拓展; 它同时为发布和订阅提供高吞吐量; 它支持多订 阅读全文
posted @ 2017-11-08 10:19 RZ_Lee 阅读(254) 评论(0) 推荐(0) 编辑
摘要: 用户编写Storm Topology 使用client提交Topology给Nimbus Nimbus指派Task给Supervisor Supervisor为Task启动Worker Worker执行Task 阅读全文
posted @ 2017-11-08 09:33 RZ_Lee 阅读(220) 评论(0) 推荐(0) 编辑
摘要: 条件1 and 条件2 条件1 or 条件2 短路原则 对于and 如果前面的第一个条件为假,那么这个and前后两个条件组成的表达式的计算结果就一定为假,第二个条件就不会被计算 对于or 如果前面的第一个条件为真,那么这个or前后两个条件组成的表达式的计算结果就一定为真,第二个条件就不会被计算 阅读全文
posted @ 2017-11-07 08:50 RZ_Lee 阅读(307) 评论(0) 推荐(0) 编辑
摘要: 写个shell脚本Hive 按时间定期插入分区表,由于今天统计的是昨天的数据所以日期减一。 阅读全文
posted @ 2017-11-03 13:52 RZ_Lee 阅读(1355) 评论(0) 推荐(0) 编辑
摘要: step1 input InputFormat读取数据,将数据转换成<key ,value>对,设置FileInputFormat,默认是文本格式(TextInputFormat) step2 map map<KEYIN, VALUEIN, KEYOUT, VALUEOUT> 默认情况下KEYIN: 阅读全文
posted @ 2017-11-03 11:43 RZ_Lee 阅读(2773) 评论(0) 推荐(0) 编辑
摘要: 数据倾斜就是由于数据分布不均匀,数据大量集中到一点上,造成数据热点。大多数情况下,分为一下三种情况: 1.map端执行比较快,reduce执行很慢,因为partition造成的数据倾斜。 2.某些reduce很快,某些reduce很慢,也是因为partition造成的数据倾斜。 3.某些map执行很 阅读全文
posted @ 2017-11-03 01:21 RZ_Lee 阅读(4491) 评论(0) 推荐(0) 编辑
摘要: 第一次Java程序要在MySQL中执行一条语句,那么就必须建立一个Connection对象,代表了与MySQL数据库的连接通过直接发送你要执行的SQL语句之后,就会调用Connection.close()来关闭和销毁与数据库的连接。为什么要立即关闭呢?因为数据库的连接是一种很重的资源,代表了网络连接 阅读全文
posted @ 2017-10-26 17:57 RZ_Lee 阅读(206) 评论(0) 推荐(0) 编辑
摘要: 在hive中表的类型:管理表和托管表(外部表)。 内部表也称之为MANAGER_TABLE,默认存储在/user/hive/warehouse下,也可以通过location指定;删除表时,会删除表的数据以及元数据; 外部表称之为EXTERNAL_TABLE。在创建表时可以自己指定目录位置(LOCAT 阅读全文
posted @ 2017-10-25 21:49 RZ_Lee 阅读(250) 评论(0) 推荐(0) 编辑
上一页 1 ··· 5 6 7 8 9 10 11 12 13 ··· 19 下一页