摘要:
Apache Spark是专门为大数据处理而设计的通用的计算引擎。spark拥有MapReduce所具有的优点,但不同于Map Reduce的是Job中间输出结果可以缓存到内存中,从而不再需要读写HDFS,减少磁盘数据交互,因此Spark能更好的适应机器学习和数据挖掘等需要迭代的算法。 Spark提 阅读全文
摘要:
下面我们以列表为例来介绍下Python的切片操作 一.切片 一个完整的切片表达式包含两个:,用于分割列表参数,写法如下: list[start_index:end_index:step]1start_index:起始位置end_index:结束位置step:步进,为正数的时候表示从前向后,负数表示从 阅读全文