随笔档案 (754)

2025年3月(1)
2025年2月(32)
2025年1月(47)
2024年12月(34)
2024年11月(31)
2024年10月(18)
2024年9月(24)
2024年8月(31)
2024年7月(32)
2024年6月(51)
2024年5月(12)
2024年4月(43)
2024年3月(19)
2024年2月(79)
2024年1月(15)
2023年12月(55)
2023年11月(32)
2023年10月(56)
2023年9月(33)
2023年8月(15)
2023年7月(21)
2023年6月(10)
2023年5月(4)
2023年4月(1)
2023年3月(2)
2023年2月(4)
2023年1月(1)
2022年12月(1)
2022年11月(3)
2022年10月(2)
2022年9月(1)
2022年8月(1)
2022年7月(1)
2022年5月(1)
2022年3月(1)
2022年2月(4)
2022年1月(12)
2021年12月(1)
2021年2月(2)
2021年1月(1)
2020年12月(3)
2020年11月(3)
2020年9月(1)
2020年5月(1)
2020年4月(2)
2020年3月(7)
2019年11月(1)
2019年10月(2)
更多

阅读排行榜

1. Ubuntu - 设置中英文输入法切换快捷键(6278)
2. U盘安装系统花屏问题解决(2625)
3. Matplotlib - RuntimeError: main thread is not in main loop(2395)
4. Kubernetes - k8s cluster(1484)
5. Ubuntu - 分区设置(1197)

2025年2月1日

PySpark - Data Ingestion and Data Extraction

摘要： from pyspark.sql.functions import flatten, collect_list # create a DataFrame with an array of arrays column df = spark.createDataFrame([ (1, [[1, 2], 阅读全文

posted @ 2025-02-01 22:45 ZhangZhihuiAAA 阅读(7) 评论(0) 推荐(0) 编辑

Dockerfile - base, spark-base, spark-master, spark-worker, jupyterlab (Spark 3.4.1)

摘要： build.sh: #!/bin/bash # # -- Build Apache Spark Standalone Cluster Docker Images # # -- Variables # BUILD_DATE="$(date -u +'%Y-%m-%d')" SPARK_VERSION= 阅读全文

posted @ 2025-02-01 20:24 ZhangZhihuiAAA 阅读(4) 评论(0) 推荐(0) 编辑

导航

搜索

常用链接

我的标签

随笔档案 (754)

阅读排行榜

2025年2月1日


Copyright © 2025 ZhangZhihuiAAA Powered by .NET 9.0 on Kubernetes 博客园