沙沙沙啊啊皮

2018年8月27日

摘要：这里的 pyspark 是spark安装的文件夹里python文件夹下的，需要复制到anoconda的Lib下site-packages中代码中没有环境变量的配置，不愿意在本机配置环境变量的可以去查查spark在python中环境变量配置阅读全文

posted @ 2018-08-27 15:59 沙沙沙啊啊皮阅读(2210) 评论(0) 推荐(0) 编辑

学习随笔--pyspark RDD常用操作

摘要： # -*- coding:utf-8 -*- from pyspark import SparkContext, SparkConf from pyspark.streaming import StreamingContext import math appName = "jhl_spark_1" # 你的应用程序名称 master = "local" # 设置单机 conf = Spar... 阅读全文

posted @ 2018-08-27 15:55 沙沙沙啊啊皮阅读(1912) 评论(0) 推荐(0) 编辑

2018年8月23日

学习随笔--Spark java开发入门

摘要：简单的java项目开发，所需Jar包见百度网盘链接：https://pan.baidu.com/s/1jqWwBBNIm1kbQoFSCppEZQ 密码：y4xr 阅读全文

posted @ 2018-08-23 11:44 沙沙沙啊啊皮阅读(1601) 评论(0) 推荐(0) 编辑

2018年8月20日

学习随笔--flask框架基本搭建

摘要：一、简介 Flask是一个基于Python的web框架，它的设计目的是提供Web开发所需的最小功能子集。Flask没有绑定诸如数据库查询或者表单处理等功能库，以及它们所组成的整个生态系统。它倾向于对这些功能的实现方式不做任何限定安装 Flask 最便捷的方式是使用虚拟环境。虚拟环境是 Python 阅读全文

posted @ 2018-08-20 08:40 沙沙沙啊啊皮阅读(223) 评论(0) 推荐(0) 编辑

2018年8月15日

学习随笔--scrapy爬虫简单实例

摘要：一、运行F:\Anaconda\Scripts\scrapy startproject scrapy_test生成scrapy项目的默认结构其中： crapy.cfg: 项目的配置文件。 scrapy_test/: 该项目的python模块。之后您将在此加入代码。 scrapy_test/item 阅读全文

posted @ 2018-08-15 15:59 沙沙沙啊啊皮阅读(267) 评论(0) 推荐(0) 编辑

2018年8月14日

学习随笔-python动态爬取空气质量网数据的实现

摘要：想爬取https://www.aqistudy.cn/空气质量网上的河北省空气历史数据，之前使用python写过基于scrapy的爬虫，想故技重施发现爬取不到想要的数据，仔细看过网页源代码后发现表格中的数据是动态加载的，使用开发者工具想要查看传输的数据结果发现数据被加密了，百度过解决办法后决定选阅读全文

posted @ 2018-08-14 15:49 沙沙沙啊啊皮阅读(1009) 评论(0) 推荐(0) 编辑