始终不够啊 - 博客园

2020年1月29日

摘要：目录：一、ansible的下载安装二、ssh的认证方式三、ansible的命令格式四、查看ansible生成的文件的方法五、ansible-doc 查看模块的帮助信息六、模块 1. 命令相关模块 2. 文件相关模块 3. 软件相关模块 4. 计划任务模块cron 5. 用户相关模块 6. 阅读全文

posted @ 2020-01-29 17:32 始终不够啊阅读(191) 评论(0) 推荐(0)

2020年1月28日

Celery - 一个懂得异步任务 , 定时任务 , 周期任务的芹菜

摘要：目录： 1、什么是celery 2、celery简单示例 3、celery结合flask模拟抢购系统 4、celery项目目录 5、celery定时任务 6、celery周期任务 1.什么是Celery? Celery 是芹菜Celery 是基于Python实现的模块, 用于执行异步定时周期任务的其阅读全文

posted @ 2020-01-28 19:24 始终不够啊阅读(180) 评论(0) 推荐(0)

Flask之Flask-Migrate

摘要：问题：Flask支持 makemigration / migrate 吗? 答案：如果你同时拥有两个三方组件 Flask-Script 和 Flask-Migrate 那么就支持这样的动作首先你要有几个准备工作项目下载 1.安装 Flask-Migrate pip install Flask-M 阅读全文

posted @ 2020-01-28 01:18 始终不够啊阅读(164) 评论(0) 推荐(0)

2020年1月27日

Flask之Flask-Script

摘要： Flask-Script 从字面意思上来看就是 Flask 的脚本 Django的启动命令 python manage.py runserver 其实Flask也可以做到,基于 Flask-Script 就可以了 - 但是你还是得有一个干净的项目点击下载 1.安装 Flask-Script pip 阅读全文

posted @ 2020-01-27 16:11 始终不够啊阅读(239) 评论(0) 推荐(0)

2020年1月26日

Flask之Flask-SQLAlchemy

摘要：首先要先安装一下Flask-SQLAlchemy这个模块 pip install Flask-SQLAlchemy 然后你要下载一个干净的Flask项目点击下载接下来基于这个Flask项目,我们要加入Flask-SQLAlchemy让项目变得生动起来 1.加入Flask-SQLAlchemy第三阅读全文

posted @ 2020-01-26 11:31 始终不够啊阅读(108) 评论(0) 推荐(0)

2020年1月25日

SQLAlchemy

摘要： pip3 install sqlalchemy SQLAlchemy 与 Django 的 Models 区别： Models 只是配置和使用比较简单,因为他是Django自带的ORM框架,也正是因为是Django原生的,所以兼容性远远不如SQLAlchemy 真正算得上全面的ORM框架必然是我们的阅读全文

posted @ 2020-01-25 15:38 始终不够啊阅读(115) 评论(0) 推荐(0)

机器学习之K-近邻算法（KNN）

摘要： K-近邻算法（KNN）引入如何进行电影分类众所周知，电影可以按照题材分类，然而题材本身是如何定义的?由谁来判定某部电影属于哪个题材?也就是说同一题材的电影具有哪些公共特征?这些都是在进行电影分类时必须要考虑的问题。没有哪个电影人会说自己制作的电影和以前的某部电影类似，但我们确实知道每部电影阅读全文

posted @ 2020-01-25 13:18 始终不够啊阅读(437) 评论(0) 推荐(0)

2020年1月24日

数据分析之tushare模块

摘要：目录： TuShare简介和环境安装 TuShare的应用一.TuShare简介和环境安装 TuShare是一个著名的免费、开源的python财经数据接口包。其官网主页为：TuShare -财经数据接口包。该接口包如今提供了大量的金融数据，涵盖了股票、基本面、宏观、新闻等诸多类别数据（具体请自行查阅读全文

posted @ 2020-01-24 20:11 始终不够啊阅读(798) 评论(0) 推荐(0)

数据分析之matplotlib

摘要：目录：一、Matplotlib基础知识 1. 包含单条曲线的图 2. 包含多个曲线的图 3. 将多个曲线图绘制在一个table区域中：对象形式创建表图 4. 网格线 plt.grid(XXX) 5. 坐标轴界限 6. 坐标轴标签 7. 图例(legend方法) 二、保存图片三、2D图形 1. 直阅读全文

posted @ 2020-01-24 15:55 始终不够啊阅读(942) 评论(0) 推荐(0)

2020年1月23日

数据分析之pandas

摘要：目录：一、Pandas的数据结构（一）Series 1. Series的创建 2. Series的索引和切片 3. Series的基本概念 4. Series的运算（二）DataFrame 1. DataFrame的创建 2. DataFrame属性：values、columns、index、阅读全文

posted @ 2020-01-23 23:16 始终不够啊阅读(822) 评论(0) 推荐(0)

数据分析之numpy

摘要：目录：一、创建ndarray 二、ndarray的属性三、ndarray的基本操作四、ndarray的聚合操作五、ndarray的排序数据分析：是把隐藏在一些看似杂乱无章的数据背后的信息提炼出来，总结出所研究对象的内在规律数据分析三剑客：Numpy,Pandas,Matplotlib N 阅读全文

posted @ 2020-01-23 15:34 始终不够啊阅读(367) 评论(0) 推荐(0)

2020年1月22日

爬虫之中国空气质量在线监测平台加密数据爬取

摘要：中国空气质量在线监测平台加密数据爬取 - 中国空气质量在线监测分析平台是一个收录全国各大城市天气数据的网站，包括温度、湿度、PM 2.5、AQI 等数据，链接为：https://www.aqistudy.cn/html/city_detail.html,网站显示为：该网站所有的空气质量数据都是基于阅读全文

posted @ 2020-01-22 16:01 始终不够啊阅读(952) 评论(1) 推荐(0)

2020年1月21日

爬虫之pyppeteer模块的基本使用

摘要：引言 Selenium 在被使用的时候有个麻烦事，就是环境的相关配置，得安装好相关浏览器，比如 Chrome、Firefox 等等，然后还要到官方网站去下载对应的驱动，最重要的还需要安装对应的 Python Selenium 库，确实是不是很方便，另外如果要做大规模部署的话，环境配置的一些问题也是个阅读全文

posted @ 2020-01-21 18:09 始终不够啊阅读(1791) 评论(0) 推荐(0)

爬虫之高性能异步爬虫

摘要：爬虫中使用异步实现高性能的数据爬取操作。背景其实爬虫的本质就是client发请求批量获取server的响应数据，如果我们有多个url待爬取，只用一个线程且采用串行的方式执行，那只能等待爬取一个结束后才能继续下一个，效率会非常低。需要强调的是：对于单线程下串行N个任务，并不完全等同于低效，如果这N 阅读全文

posted @ 2020-01-21 17:34 始终不够啊阅读(567) 评论(0) 推荐(0)

2020年1月20日

爬虫之scrapy框架

摘要：目录：一、scrapy框架简介二、环境安装及基本使用三、scrapy框架持久化存储四、scrapy框架之递归解析、五大核心组件工作流程、post请求五、scrapy框架之日志等级、请求传参、提高scrapy工作效率的方法六、scrapy框架之scrapy下载中间件、UA池、代理池七、s 阅读全文

posted @ 2020-01-20 13:27 始终不够啊阅读(418) 评论(0) 推荐(0)

2020年1月19日

爬虫之线程池concurrent.futures的使用

摘要：线程池爬取梨视频简单示例： #爬取梨视频数据 import requests import re from lxml import etree from multiprocessing.dummy import Pool import random def getVideoData(url): r 阅读全文

posted @ 2020-01-19 14:09 始终不够啊阅读(313) 评论(0) 推荐(0)

2020年1月18日

爬虫之反爬机制及代理IP

摘要：反爬机制： robots.txt协议 UA检测、referer检测数据加密图片懒加载 ip检测验证码识别字体反爬虫可以使用Python的urllib模块查看robots.txt from urllib import robotparser rp = robotparser.RobotFil 阅读全文

posted @ 2020-01-18 18:12 始终不够啊阅读(586) 评论(0) 推荐(0)

2020年1月17日

爬虫之验证码处理（超级鹰打码平台的使用）

摘要：引入相关的门户网站在进行登录的时候，如果用户连续登录的次数超过3次或者5次的时候，就会在登录页中动态生成验证码。通过验证码达到分流和反爬的效果。目录：使用超级鹰打码平台识别验证码知识点回顾 session的创建方式 session的作用 proxies参数的作用高匿，透明代理的区别超级鹰阅读全文

posted @ 2020-01-17 17:06 始终不够啊阅读(1336) 评论(0) 推荐(0)

2020年1月16日

爬虫之图片懒加载技术、selenium和PhantomJS

摘要：目录：图片懒加载 selenium phantomJs 谷歌无头浏览器知识点回顾验证码处理流程动态数据加载处理一.图片懒加载什么是图片懒加载？案例分析：抓取站长素材http://sc.chinaz.com/中的图片数据 #!/usr/bin/env python # -*- codin 阅读全文

posted @ 2020-01-16 17:55 始终不够啊阅读(331) 评论(0) 推荐(0)

2020年1月15日

爬虫之三种数据解析方式

摘要：引入回顾requests实现数据爬取的流程指定url 基于requests模块发起请求获取响应对象中的数据进行持久化存储其实，在上述流程中还需要较为重要的一步，就是在持久化存储之前需要进行指定数据解析。因为大多数情况下的需求，我们都会指定去使用聚焦爬虫，也就是爬取页面中指定部分的数据值，而阅读全文

posted @ 2020-01-15 17:50 始终不够啊阅读(391) 评论(0) 推荐(0)

公告