摘要: clickhouse安装部署 下载地址: 百度网盘下载链接:https://pan.baidu.com/s/1YdGmhGND5qA3qzBpRQaI1w 提取码:sybk clickhouse-common-static-21.9.4.35.tgz clickhouse-common-static 阅读全文
posted @ 2024-05-29 14:18 a-tao必须奥利给 阅读(74) 评论(0) 推荐(0) 编辑
摘要: Spark_DLS语法: 目录Spark_DLS语法:1.[Spark]-SQL2.DSL示例3.DSL解析json,csv文件1.printSchema() 打印表结构2.studentDF.show(100) 默认20条数据3.studentDF.show(false) 某些值太长,完整打印每一 阅读全文
posted @ 2024-05-18 17:34 a-tao必须奥利给 阅读(46) 评论(0) 推荐(0) 编辑
摘要: spark的SparkContext,SparkConf和SparkSession及dataframe和RDD的区别 SparkContext 和 SparkConf 任何Spark程序都是SparkContext开始的,SparkContext的初始化需要一个SparkConf对象,SparkCo 阅读全文
posted @ 2024-05-16 18:56 a-tao必须奥利给 阅读(124) 评论(0) 推荐(0) 编辑
摘要: nginx之使用与配置教程 原文链接:https://blog.csdn.net/qq_35056891/article/details/134391217 简介 ​ nginx是一个高性能的http和反向代理的web服务器 正向代理 反向代理 优点 速度更快、并发更高:单次请求或者高并发请求的环境 阅读全文
posted @ 2024-05-09 19:14 a-tao必须奥利给 阅读(44) 评论(0) 推荐(0) 编辑
摘要: oracle 11G 数据库归档日志清理流程。 链接:ORACLE 11g数据库归档日志清理规程 - 百度文库 (baidu.com) 阅读全文
posted @ 2024-03-27 14:19 a-tao必须奥利给 阅读(50) 评论(0) 推荐(0) 编辑
摘要: 全面解析数据治理 原文链接: 全面解析数据治理 (baidu.com) https://zhuanlan.zhihu.com/p/640465934?utm_id=0 摘要 数据治理并不是一种简单的操作行为,而是对数据资产管理行使权力和控制的活动集合,是一种管理和保护数据的方法,是确保准确性、完整性 阅读全文
posted @ 2023-11-14 08:06 a-tao必须奥利给 阅读(41) 评论(0) 推荐(0) 编辑
摘要: DataX的限速与调优 原文链接: DataX的限速与调优 - 墨天轮 (modb.pro) 5、DataX(DataX简介、DataX架构原理、DataX部署、使用、同步MySQL数据到HDFS、同步HDFS数据到MySQL)-CSDN博客 前 言 众所周知,当一个程序需要传输数据的时候,它肯定会 阅读全文
posted @ 2023-11-14 07:55 a-tao必须奥利给 阅读(2357) 评论(0) 推荐(0) 编辑
摘要: VMware ESXi 链接: esxi是什么系统_exsi-CSDN博客 阅读全文
posted @ 2023-10-19 22:58 a-tao必须奥利给 阅读(9) 评论(0) 推荐(0) 编辑
摘要: 大数据集群安装部署类:CDH和HDP CDH集群安装步骤: https://blog.csdn.net/wt334502157/article/details/120290580 HDP集群安装步骤: 【大数据】大数据 Hadoop 管理工具 Apache Ambari(HDP)_ambari hd 阅读全文
posted @ 2023-10-19 22:46 a-tao必须奥利给 阅读(45) 评论(0) 推荐(0) 编辑
摘要: CDH集群日志清理 一、查看磁盘占用情况 df -h 二、查看日志占用情况 cdh的各种组件日志一般在 /var/log 目录下,因此需要关注“/”根目录, 查看 /var/log 下使用空间较大的文件夹,并又大到小排列 cd /var/log/ du -s ./* |sort -nr 还有一个是 阅读全文
posted @ 2023-10-19 22:21 a-tao必须奥利给 阅读(297) 评论(0) 推荐(0) 编辑