导航

2021年5月6日

摘要: Abstract: 参照入门学习路径学习了两个代码示例,对比我们项目的代码做了笔记。 链接: https://zhuanlan.zhihu.com/p/52753778 https://github.com/apache/spark/blob/master/examples/src/main/sca 阅读全文

posted @ 2021-05-06 20:34 空格已敲小明快跑鸭 阅读(112) 评论(0) 推荐(0) 编辑

摘要: Abstract: 参照“背景知识查阅”一文的学习路径,对几篇文章的学习做了记录。这是"Beginner Tutorial"一文的学习笔记。 文章链接: https://www.datacamp.com/community/tutorials/apache-spark-python 1. 背景知识 阅读全文

posted @ 2021-05-06 17:55 空格已敲小明快跑鸭 阅读(85) 评论(0) 推荐(0) 编辑

摘要: 和三位小伙伴一起做了一个Credit Fraud Detection的项目。数据是Kaggle上的数据,主要是用supervised learning 来解决fraud的(多)分类问题。 这个项目有两个重点:数据处理,算法实现。 因为这是Spark的入门项目,主要的精力放在用PySpark处理数据, 阅读全文

posted @ 2021-05-06 04:25 空格已敲小明快跑鸭 阅读(41) 评论(0) 推荐(0) 编辑

摘要: PySpark Documentation: https://spark.apache.org/docs/latest/api/python/index.html Beginner Tutorial: https://www.datacamp.com/community/tutorials/apac 阅读全文

posted @ 2021-05-06 04:02 空格已敲小明快跑鸭 阅读(37) 评论(0) 推荐(0) 编辑