03 2020 档案
摘要:一、什么是RDD A Resilient Distributed Dataset (RDD), the basic abstraction in Spark. Represents an immutable, partitioned collection of elements that can b
阅读全文
摘要:PySpark环境搭建需要以下的安装包或者工具: Anaconda JDK1.8 hadoop2.6 hadooponwindows-master spark2.0 py4j pyspark扩展包 1、hadoop 这里不详细说明Anaconda、JDK的安装与配置过程,主要说明与spark相关内容
阅读全文
摘要:一、Django项目创建 (一)虚拟环境创建 首先创建一个虚拟环境,用于Django项目使用,在CMD窗口中通过下面的命令: mkvirtualenv celery_test 其中celery_test 为虚拟环境名称,这里使用的python解释器就是默认安装的,你也可以指定python解释器: m
阅读全文
摘要:一、安装 Elasticsearch是一个基于Apache Lucene(TM)的开源搜索引擎。它提供了一个分布式多用户能力的全文搜索引擎,基于RESTful web接口。 (一)Elasticsearch下载与安装 1、Elasticsearch的下载 官网下载有时太慢,这里分享一个链接:链接:h
阅读全文