posted @ 2023-08-14 16:33 steve.z 阅读(70) 评论(0) 推荐(0) 编辑
摘要:
```python # # py_pyspark_demo2.py # py_learn # # Created by Z. Steve on 2023/8/13 10:55. # import json # 1. 导入库 from pyspark import SparkConf, SparkCo 阅读全文
摘要:
```python # # py_spark_rdd2py.py # py_learn # # Created by Z. Steve on 2023/8/13 11:39. # # 1. rdd.collect() 将 rdd 变为 list # 2. rdd.reduce() 不分组, 对 rd 阅读全文
posted @ 2023-08-13 15:46 steve.z 阅读(45) 评论(0) 推荐(0) 编辑
摘要:
```python # # py_pyspark_demo2.py # py_learn # # Created by Z. Steve on 2023/8/13 10:55. # import json # 1. 导入库 from pyspark import SparkConf, SparkCo 阅读全文
posted @ 2023-08-13 11:37 steve.z 阅读(6) 评论(0) 推荐(0) 编辑
摘要:
```python # # py_pyspark_test.py # py_learn # # Created by Z. Steve on 2023/8/12 17:38. # from pyspark import SparkConf, SparkContext conf = SparkConf 阅读全文
posted @ 2023-08-13 10:55 steve.z 阅读(126) 评论(0) 推荐(0) 编辑
摘要:
```python # # py_pyspark_demo.py # py_learn # # Created by Z. Steve on 2023/8/12 15:33. # # 统计文件中各个单词出现的次数 # 1. 导入库 from pyspark import SparkConf, Spa 阅读全文
posted @ 2023-08-12 17:32 steve.z 阅读(28) 评论(0) 推荐(0) 编辑
摘要:
```python # # py_pyspark.py # py_learn # # Created by Z. Steve on 2023/8/10 17:51. # # pyspark 编程主要分三步:1. 数据输入。2. 数据处理。3. 数据输出。 # RDD:Resilient Distri 阅读全文
posted @ 2023-08-12 15:23 steve.z 阅读(56) 评论(0) 推荐(0) 编辑
摘要:
```bash # macOS 操作 MySQL 服务 # 启动MySQL mysql.server start # 停止MySQL mysql.server stop # 重启 MySQL mysql.server restart # 查看当前 MySQL 服务状态 mysql.server st 阅读全文
posted @ 2023-08-10 17:42 steve.z 阅读(35) 评论(0) 推荐(0) 编辑
摘要:
```python # # py_factory.py # py_learn # # Created by Z. Steve on 2023/8/8 10:17. # # 工厂模式优点: # 1. 大批量创建对象是, 有统一的入口, 易于代码维护。 # 2. 当发生修改时,只需要修改工厂类的创建方法 阅读全文
posted @ 2023-08-08 10:29 steve.z 阅读(10) 评论(0) 推荐(0) 编辑