07 2020 档案

pyspark On Yarn 的模块依赖问题
摘要:创建自定义模块dependency/myda... 阅读全文

posted @ 2020-07-31 15:38 疯狂的小萝卜头 阅读(423) 评论(0) 推荐(0) 编辑

spark 报错:UnicodeEncodeError: ‘ascii‘ codec can‘t encode characters in position 解决方法
摘要:pyspark 调用DataFrame.sh... 阅读全文

posted @ 2020-07-31 14:35 疯狂的小萝卜头 阅读(2029) 评论(0) 推荐(0) 编辑

spark 报错:Protocol message end-group tag did not match expected tag 解决方法
摘要:spark将结果存回hdfs时,如果使用90... 阅读全文

posted @ 2020-07-31 11:32 疯狂的小萝卜头 阅读(3274) 评论(0) 推荐(0) 编辑

hive 向表中导入数据时忽略首行
摘要:问题在使用load data inpath ... 阅读全文

posted @ 2020-07-30 16:11 疯狂的小萝卜头 阅读(4144) 评论(0) 推荐(1) 编辑

python 利用pyspark读取HDFS中CSV文件的指定列 列名重命名 并保存回HDFS
摘要:需求读取HDFS中CSV文件的指定列,并对列... 阅读全文

posted @ 2020-07-28 17:56 疯狂的小萝卜头 阅读(4653) 评论(0) 推荐(0) 编辑

python 利用pandas读取本地中CSV文件的指定列 列名重命名 并保存回本地
摘要:需求读取本地中CSV文件的指定列,并对列进行... 阅读全文

posted @ 2020-07-28 17:43 疯狂的小萝卜头 阅读(6915) 评论(0) 推荐(0) 编辑

CDH版本Hbase二级索引详细配置方案Solr key value index(二)中文分词
摘要:前提已完成二级索引创建,请参照:https:... 阅读全文

posted @ 2020-07-27 16:39 疯狂的小萝卜头 阅读(214) 评论(0) 推荐(0) 编辑

CDH版本Hbase二级索引详细配置方案Solr key value index
摘要:概述Hbase在Hbase中,表的RowKe... 阅读全文

posted @ 2020-07-24 17:11 疯狂的小萝卜头 阅读(316) 评论(0) 推荐(0) 编辑

impala 和 hive安装及基础使用
摘要:impala 安装具体安装步骤参照:http... 阅读全文

posted @ 2020-07-22 17:59 疯狂的小萝卜头 阅读(622) 评论(0) 推荐(0) 编辑

Centos7 安装包方式(离线)安装Cloudera Manager和CDH
摘要:Cloudera Manager 技术架构A... 阅读全文

posted @ 2020-07-17 12:35 疯狂的小萝卜头 阅读(734) 评论(0) 推荐(0) 编辑

< 2025年3月 >
23 24 25 26 27 28 1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30 31 1 2 3 4 5

统计

点击右上角即可分享
微信分享提示