06 2019 档案

Spark JDBC系列--Mysql tinyInt字段特殊处理

摘要：当spark取出表的scheme中，类型名为tinyint的字段，会被处理为Boolean型。而mysql中tinyint的sqlType都会默认处理为bit，所以如果数据库中的这类字段中，存储了0、1之外的值，拉取数据时则会出现数据失真。处理方式：在JDBC的URL中加入参数：tinyInt1 阅读全文

posted @ 2019-06-19 22:54 chenzechao 阅读(641) 评论(0) 推荐(0) 编辑

数据库与数据仓库的区别

摘要：数据库是面向事务的设计，数据仓库是面向主题设计的。数据库一般存储在线交易数据，数据仓库存储的一般是历史数据。数据库设计是尽量避免冗余，一般采用符合范式的规则来设计，数据仓库在设计是有意引入冗余，采用反范式的方式来设计。数据库是为捕获数据而设计，数据仓库是为分析数据而设计，它的两个基本的元素是维阅读全文

posted @ 2019-06-18 09:59 chenzechao 阅读(2593) 评论(0) 推荐(0) 编辑

Spark Steaming消费kafka数据条数变少问题

摘要：对于基于Receiver 形式，我们可以通过配置 spark.streaming.receiver.maxRate 参数来限制每个 receiver 每秒最大可以接收的记录的数据；对于 Direct Approach 的数据接收，我们可以通过配置 spark.streaming.kafka.maxR 阅读全文

posted @ 2019-06-10 09:55 chenzechao 阅读(1022) 评论(0) 推荐(0) 编辑

intellij idea 搜索

摘要：1. Ctrl+N 按名字搜索类相当于eclipse的ctrl+shift+R，输入类名可以定位到这个类文件就像idea在其它的搜索部分的表现一样，搜索类名也能对你所要搜索的内容多个部分进行匹配甚至不是自己写的类也能搜索而且如果能匹配的自己写的类，优先匹配自己写的类 2. Ctrl+Shift+N 按文件名搜索文件同搜索类类似，只不过可以匹配... 阅读全文

posted @ 2019-06-10 08:43 chenzechao 阅读(1917) 评论(0) 推荐(0) 编辑

ZooKeeper shell

摘要：ref: https://blog.csdn.net/qq_41455420/article/details/79399096 阅读全文

posted @ 2019-06-10 08:39 chenzechao 阅读(279) 评论(0) 推荐(0) 编辑

公告

昵称： chenzechao
园龄： 8年8个月
粉丝： 10
关注： 2

+加关注

2025年3月

日

一

二

三

四

五

六

chenzechao

06 2019 档案

公告

搜索

我的标签

随笔分类

随笔档案

阅读排行榜

推荐排行榜

最新评论