上一页 1 ··· 3 4 5 6 7 8 9 10 11 ··· 21 下一页
摘要: pyspark读取hdfs 二进制文件 pickle 模型文件 model 我们在python环境训练的机器学习、深度学习模型二进制文件,比如pickle 如果需要提交到spark-submit上,需要先把文件上传到hdfs目录下,然后读取 hadoop fs -put 模型文件 hdfs目录 如 阅读全文
posted @ 2022-05-09 13:29 cup_leo 阅读(1003) 评论(0) 推荐(0) 编辑
摘要: linux 搭建 pyspark (21条消息) Linux服务器下PySpark环境安装_Viva Python的博客-CSDN博客_pyspark安装 pyspark基于python虚拟环境运行 - 倪平凡 - 博客园 (cnblogs.com) (21条消息) pyspark使用anacond 阅读全文
posted @ 2022-05-06 20:06 cup_leo 阅读(385) 评论(0) 推荐(0) 编辑
摘要: hive一个字段包含另一个字段 1.源数据表ta byu yuxiaogang array_contains(split(,' '),a) hive一个字段包含另一个字段_甲家家的博客-CSDN博客_hive一个字段包含另一个字段 where array_contains(split(phone_z 阅读全文
posted @ 2022-04-19 17:25 cup_leo 阅读(899) 评论(0) 推荐(0) 编辑
摘要: 字帖工具 - 在线工具 (tool.lu) 阅读全文
posted @ 2022-04-07 16:22 cup_leo 阅读(54) 评论(0) 推荐(0) 编辑
摘要: import datetime #打印当前时间 def printbar(): nowtime = datetime.datetime.now().strftime('%Y-%m-%d %H:%M:%S') print("\n"+" "*8 + "%s"%nowtime) 阅读全文
posted @ 2022-03-04 14:52 cup_leo 阅读(36) 评论(0) 推荐(0) 编辑
摘要: #!/bin/bash date=`date -d "-1 day" +%F` spark-submit \ --class ****** \ --name "*** ***" \ --master yarn \ --deploy-mode client \ --num-executors 30 \ 阅读全文
posted @ 2022-03-02 09:50 cup_leo 阅读(66) 评论(0) 推荐(0) 编辑
摘要: regexp = "\\(.*?\\)|\\{.*?}|\\[.*?]|(.*?)" hive: regexp_replace(name,"\\(.*?\\)|\\{.*?}|\\[.*?]|(.*?",'') 阅读全文
posted @ 2022-01-21 11:55 cup_leo 阅读(393) 评论(0) 推荐(0) 编辑
摘要: FlyClockV5.7.0.exe FlyClock下载_FlyClock官方免费下载[最新版]-下载之家 (downza.cn) 阅读全文
posted @ 2022-01-18 10:36 cup_leo 阅读(52) 评论(0) 推荐(0) 编辑
摘要: (47条消息) 推荐系统架构详解_LitraLIN的博客-CSDN博客_推荐系统架构 扬奇智能公开课 | 个性化推荐技术在网易云音乐中的应用 - 知乎 (zhihu.com) 阅读全文
posted @ 2022-01-14 13:53 cup_leo 阅读(14) 评论(0) 推荐(0) 编辑
摘要: SELECT bit_column+0 as bit_column from *****对应bit列字段加上0就可以了 阅读全文
posted @ 2022-01-06 09:23 cup_leo 阅读(387) 评论(0) 推荐(0) 编辑
上一页 1 ··· 3 4 5 6 7 8 9 10 11 ··· 21 下一页