摘要: 一. Spark介绍 Spark是一个分布式计算平台。运算速度远超于HDFS,并且能与python、java更好地交互。 我的疑问:在数据处理/模型训练的过程中,Spark这个平台是需要我手动写一些代码,例如读取数据啥的,还是我只要在带有pyspark的kernal的平台上运行就可以?kernal是 阅读全文
posted @ 2020-08-13 10:09 一卷 阅读(290) 评论(0) 推荐(0) 编辑