会员
周边
捐助
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
SAM's DATA RIVER
山姆大叔的 DATA BLOG
博客园
首页
新随笔
联系
管理
订阅
2022年6月14日
一个因为windows系统缺失文件而导致的pyspark的BUG
摘要: exitCode=-1073741515 saveAsTextFile
阅读全文
posted @ 2022-06-14 19:19 gaussen126
阅读(69)
评论(0)
推荐(0)
编辑
使用pyspark 建立spark 的累加器
摘要: 一,累加器特征 1,PySpark累加器是一个共享变量,与RDD和DataFrame一起使用,以执行与Map reduce计数器类似的求和和和计数器操作。 2,只有分布在各个节点上的task任务才能更新累加器的数值,并且只有driver 端可以读取数值。 二,累加器的创建和使用 sparkConte
阅读全文
posted @ 2022-06-14 11:11 gaussen126
阅读(370)
评论(0)
推荐(0)
编辑
公告