摘要: python基础回顾 1.Ipython魔术命令 %timeit //多次执行一条语句,并返回平均时间,%%time->多条语句,用于测试一条语句用了多少时间 %time //返回执行一条语句的时间 %rest //删除当前空间的全部变量 %run*.py //在IPython中执行python脚本 阅读全文
posted @ 2018-09-30 15:03 stone1234567890 阅读(354) 评论(0) 推荐(0) 编辑
摘要: 学习spark,RDD是一个逃不过去的话题,那么接下来我们看看RDD 1.什么是RDD? RDD叫做弹性分布式数据集,是Spark中最基本的数据抽象,代表一个不可变、可分区、里面元素可以并行计算的集合。RDD具有数据流模型的特点:自动容错、位置感知性调度和可伸缩性。RDD允许用户在执行多个查询时显式 阅读全文
posted @ 2018-09-30 07:29 stone1234567890 阅读(508) 评论(0) 推荐(0) 编辑