会员
周边
众包
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
时间的往事
所有命运赠送的礼物,早已在暗中标着价格。
博客园
首页
新随笔
联系
管理
上一页
1
2
3
4
5
6
7
8
9
···
22
下一页
2022年2月8日
Flink watermark设置
摘要: Scala: .map(x=> JSON.parseObject(x)) .assignTimestampsAndWatermarks( WatermarkStrategy.forBoundedOutOfOrderness[JSONObject](Duration.ofSeconds(3)) .wi
阅读全文
posted @ 2022-02-08 22:11 硅谷工具人
阅读(68)
评论(0)
推荐(0)
2022年2月7日
Flink中设置状态的超时
摘要: 在监控中保存某个状态值,但是过一段时间后需要将该值清理掉,防止对业务有影响或者堆积浪费存储空间。 flink提供了状态超时设置。 实例如下: class MyFilter extends RichFilterFunction[JSONObject]{ var dateState: ValueStat
阅读全文
posted @ 2022-02-07 17:17 硅谷工具人
阅读(324)
评论(0)
推荐(0)
2022年1月31日
Flink大厂应用视频
摘要: 1. 美团 - 基于Flink的典型etl场景实现 (1小时) 2. Flink官方提供的企业案例 1) 美团实时数仓平台建设2021新进展 (20分钟) 2)快手实时数仓保障体系研发实战(31分钟) 3)腾讯云原生实时数仓建设实战(24分钟) 4)理想汽车基于Flink的实时数仓0-1建设 (21
阅读全文
posted @ 2022-01-31 00:35 硅谷工具人
阅读(77)
评论(0)
推荐(0)
2022年1月24日
记录某个花了我三四天时间才解决的一个因为手残导致的问题
摘要: 案例场景:flink实时数仓项目,在建设dwd层时,通过flinkcdc监控配置表。 当在配置表中指定某个业务表的数据发送到phoenix时,就自动将业务数据写入phoenix。 当在配置表中指定某个业务表的数据发送到kafka时,就自动将业务数据发送到kafka。 这样在从源头kafka消费业务数
阅读全文
posted @ 2022-01-24 23:51 硅谷工具人
阅读(68)
评论(0)
推荐(0)
2022年1月20日
FlinkCDC读取MySQL并写入Kafka案例(com.ververica)
摘要: 该方法使用的是com.ververica版本的flink-connector-mysql-cdc,另一个版本测试也没问题了,见https://www.cnblogs.com/30go/p/15773357.html。 注意版本,不同版本组合可能会出现一些异常的情况: flink1.12.7 flin
阅读全文
posted @ 2022-01-20 01:18 硅谷工具人
阅读(2438)
评论(0)
推荐(0)
2022年1月16日
FlinkCDC在生产环境测试时一直报错没有MySQL的RELOAD权限
摘要: 之前测试环境用root没这个问题。换到生产环境指定的某个mysql账号出现权限不足: Caused by: java.sql.SQLSyntaxErrorException: Access denied; you need (at least one of) the RELOAD privilege
阅读全文
posted @ 2022-01-16 01:11 硅谷工具人
阅读(871)
评论(0)
推荐(0)
2022年1月15日
ssh免密不成功-比较怪异的一台机器
摘要: 通常情况下,不需要修改/etc/ssh/sshd_config 这个文件,就可以登录成功。但是就会偶发性存在那么怪异的一台,ssh操作一起正常,就是不成功。 1.检查authorized_keys文件权限,并设置为700 chmod 700 authorized_keys 2.检查/etc/ssh/
阅读全文
posted @ 2022-01-15 14:49 硅谷工具人
阅读(110)
评论(0)
推荐(0)
2022年1月14日
批处理脚本
摘要: 1. 批量kafka操作脚本 start & stop #! /bin/bash # 批量操作kafka kafka_path=/opt/local/kafka server_list='hadoop200 hadoop201 hadoop202' usage="Usage: $0 (start|s
阅读全文
posted @ 2022-01-14 14:44 硅谷工具人
阅读(36)
评论(0)
推荐(0)
2022年1月6日
FlinkCDC读取MySQL并写入Kafka案例(com.alibaba.ververica)
摘要: 场景应用:将MySQL的变化数据转为实时流输出到Kafka中。 注意版本问题,版本不同可能会出现异常,以下版本测试没问题: flink1.12.7 flink-connector-mysql-cdc 1.3.0(com.alibaba.ververica) (测试时使用1.2.0版本时会出现空指针错
阅读全文
posted @ 2022-01-06 23:26 硅谷工具人
阅读(5681)
评论(9)
推荐(0)
2021年11月4日
Spark读取MySQL优化设置
摘要: Spark读取MySQL优化设置: 参考:https://blog.csdn.net/bowenlaw/article/details/108076772 参考官方文档: http://spark.apache.org/docs/2.4.8/sql-data-sources-jdbc.html
阅读全文
posted @ 2021-11-04 16:09 硅谷工具人
阅读(156)
评论(0)
推荐(0)
2021年11月2日
ulimit -a
摘要: root账号可以通过修改 /etc/security/limits.conf 生效。 但是普通用户除了修改上面外,还需要修改 /etc/security/limits.d/20-nproc.conf 文件生效。
阅读全文
posted @ 2021-11-02 10:37 硅谷工具人
阅读(106)
评论(0)
推荐(0)
2021年10月17日
Flink之滑动窗口
摘要: 统计最近1个小时内的热门商品,并且每隔5分钟更新一次。 在1.10版本中 dataStream.keyBy("itemId").timeWindow(Time.hours(1), Time.minutes(5)) 在flink的1.12之后版本中 dataStream.keyBy(_.itemId)
阅读全文
posted @ 2021-10-17 12:07 硅谷工具人
阅读(312)
评论(0)
推荐(0)
2021年10月6日
flink1.14.0中集成hive3.1.2
摘要: 不想看太多的话,直接拉到第二部分操作步骤: 1. 是解决过程: 在flink1.14.0中已经移除sql-client-defaults.yml配置文件了。 参考地址:https://issues.apache.org/jira/browse/FLINK-21454 于是我顺着这个issue找到了F
阅读全文
posted @ 2021-10-06 03:05 硅谷工具人
阅读(4147)
评论(2)
推荐(1)
2021年9月26日
hive中的传参与变量
摘要: 发现自己确实越来越笨,好在解决了。 通常将hive的连接信息和sql语句写在一个脚本里面执行,这样看起来方便,修改起来也方便。 但是最近由于sql语句太长了,所以拆开两部分。一部分是hive的连接,另一部分是sql文件。通过-f传参执行。 beeline --hiveconf mapreduce.j
阅读全文
posted @ 2021-09-26 12:42 硅谷工具人
阅读(667)
评论(0)
推荐(0)
2021年9月22日
hive自定义分段函数(分箱)
摘要: 分段函数常用于分箱中,统计分组在指定的区间中的占比。 比如有如下例子:统计某个班级中考试分数在各个阶段的占比。 准备的数据如下: 使用如下文件在hive中建表。 class1,1,100 class1,2,88 class1,3,90 class1,4,23 class1,5,30 class1,6
阅读全文
posted @ 2021-09-22 21:34 硅谷工具人
阅读(2109)
评论(0)
推荐(0)
2021年9月7日
hadoop配置在线刷新
摘要: 动态刷新hdfs配置:hdfs dfsadmin -fs hdfs://nn1:8020 -refreshSuperUserGroupsConfigurationhdfs dfsadmin -fs hdfs://nn2:8020 -refreshSuperUserGroupsConfiguratio
阅读全文
posted @ 2021-09-07 12:35 硅谷工具人
阅读(315)
评论(0)
推荐(0)
2021年9月6日
linux磁盘格式化与挂载
摘要: 1. 分配路径 先创建要挂在的路径 ,比如要将盘挂到/dfs/data1这个路径下面 mkdir -p /dfs/data1/ 2. 格式化磁盘 mkfs.xfs /dev/sda 3. 挂载磁盘(临时,重启后失效) mount /dev/sda /dfs/data1/ 这一步只是临时挂载,要永久挂
阅读全文
posted @ 2021-09-06 15:31 硅谷工具人
阅读(1732)
评论(0)
推荐(0)
2021年8月21日
str_to_map使用
摘要: 表字段中jsonStr是一个json格式的字符串,类似于map结构。{"name”:"king", "age":18, "score":99} 使用str_to_map可以转化为map结构。 str_to_map(regexp_replace(regexp_replace(regexp_replac
阅读全文
posted @ 2021-08-21 14:15 硅谷工具人
阅读(2082)
评论(0)
推荐(0)
2021年8月16日
web3j和spark的okhttp3包冲突问题解决
摘要: 最近以太坊的分叉,新增了一些字段,原来使用的是老版本 web3j-spring-boot-starter <groupId>org.web3j</groupId> <artifactId>web3j-spring-boot-starter</artifactId> <version>1.6.0</v
阅读全文
posted @ 2021-08-16 19:49 硅谷工具人
阅读(1100)
评论(0)
推荐(0)
2021年8月12日
hive表新增字段无法覆盖写入内容
摘要: 今天遇到hive表新增字段,以往建表都是建外表,直接drop后,重新创建。 由于这次全部使用内表创建的,所以使用add column功能新增字段。 alter table xy_dw.dw_transaction_eth add columns(type1 string comment '类型');
阅读全文
posted @ 2021-08-12 15:52 硅谷工具人
阅读(303)
评论(0)
推荐(0)
上一页
1
2
3
4
5
6
7
8
9
···
22
下一页
公告
成功之道,在于每个人生阶段都要有不同的目标,并且通过努力实现自己的目标,毕竟人生不过百年! 所有奋斗的意义在于为个人目标实现和提升家庭幸福,同时能推进社会进步和国家目标! 正如古人讲的正心诚意格物致知,修身齐家治国平天下。