摘要: 首先,目标是写个python脚本,跑spark程序来统计hdfs中的一些数据。参考了别人的代码,故用了luigi框架。 至于luigi的原理 底层的一些东西Google就好。本文主要就是聚焦快速使用,知其然不知其所以然。 python写Spark或mapreduce还有其他的方法,google上很多 阅读全文
posted @ 2017-06-12 21:25 锅贴君的包子铺 阅读(2211) 评论(0) 推荐(0) 编辑
摘要: 这是在公司将服务部署上线的一个记录,只是部署很小的python脚本,各公司不同,参考性不是很大 开始吧(版本管理是git) 1.整理好代码后:git add xxx.py git commit -m "输入这次提交的说明" 2.代码review:git push origin HEAD:refs/f 阅读全文
posted @ 2017-06-12 18:53 锅贴君的包子铺 阅读(700) 评论(0) 推荐(0) 编辑