Fork me on GitHub

03 2020 档案

摘要:一、什么是RDD A Resilient Distributed Dataset (RDD), the basic abstraction in Spark. Represents an immutable, partitioned collection of elements that can b 阅读全文
posted @ 2020-03-29 17:28 iveBoy 阅读(3955) 评论(0) 推荐(0) 编辑
摘要:PySpark环境搭建需要以下的安装包或者工具: Anaconda JDK1.8 hadoop2.6 hadooponwindows-master spark2.0 py4j pyspark扩展包 1、hadoop 这里不详细说明Anaconda、JDK的安装与配置过程,主要说明与spark相关内容 阅读全文
posted @ 2020-03-28 20:05 iveBoy 阅读(3204) 评论(0) 推荐(1) 编辑
摘要:一、Django项目创建 (一)虚拟环境创建 首先创建一个虚拟环境,用于Django项目使用,在CMD窗口中通过下面的命令: mkvirtualenv celery_test 其中celery_test 为虚拟环境名称,这里使用的python解释器就是默认安装的,你也可以指定python解释器: m 阅读全文
posted @ 2020-03-22 20:43 iveBoy 阅读(1379) 评论(3) 推荐(0) 编辑
摘要:一、安装 Elasticsearch是一个基于Apache Lucene(TM)的开源搜索引擎。它提供了一个分布式多用户能力的全文搜索引擎,基于RESTful web接口。 (一)Elasticsearch下载与安装 1、Elasticsearch的下载 官网下载有时太慢,这里分享一个链接:链接:h 阅读全文
posted @ 2020-03-08 19:58 iveBoy 阅读(6532) 评论(0) 推荐(0) 编辑

TOP
点击右上角即可分享
微信分享提示