摘要: import logging import os from logging.handlers import TimedRotatingFileHandler import coloredlogs # 设置颜色 coloredlogs.DEFAULT_FIELD_STYLES = {'asctime' 阅读全文
posted @ 2019-12-05 09:07 屁桃 阅读(1916) 评论(0) 推荐(0) 编辑
摘要: from pdfminer.pdfparser import PDFParser, PDFDocument from pdfminer.pdfinterp import PDFResourceManager, PDFPageInterpreter, PDFTextExtractionNotAllow 阅读全文
posted @ 2019-11-28 10:00 屁桃 阅读(920) 评论(1) 推荐(1) 编辑
摘要: SMTP是发送邮件的协议,Python内置对SMTP的支持,可以发送纯文本邮件、HTML邮件以及带附件的邮件。python发邮件需要掌握两个模块的用法,smtplib和email,这俩模块是python自带的,只需import即可使用。smtplib模块主要负责发送邮件,email模块主要负责构造邮 阅读全文
posted @ 2019-10-12 17:00 屁桃 阅读(566) 评论(0) 推荐(0) 编辑
摘要: import itchat def we_chat(message): #enableCmdQR=2用于linux中显示二维码,hotReload=True退出程序后暂存登录状态 itchat.auto_login(hotReload=True,enableCmdQR=2) boom_remark_ 阅读全文
posted @ 2019-08-27 16:59 屁桃 阅读(924) 评论(1) 推荐(1) 编辑
摘要: 我们的信息都是放到redis的缓存中,结构为list,如果知道特定的值的话,通过LREM key count value这样就可以。对于redis的list结构,获取某个位置的值通过 LINDEX key index,如果想要获取list的长度,通过LLEN key来获取。对于list中特定值的删除 阅读全文
posted @ 2019-07-17 13:06 屁桃 阅读(26526) 评论(0) 推荐(0) 编辑
摘要: 方法一:微博登录 方法二:保存cookie 先保存cookie 再次登录无需验证 阅读全文
posted @ 2019-07-09 18:52 屁桃 阅读(763) 评论(0) 推荐(1) 编辑
摘要: 一.settings文件配置 二.对redis进行配置 阅读全文
posted @ 2019-06-25 10:17 屁桃 阅读(215) 评论(0) 推荐(0) 编辑
摘要: 1 click(on_element=None) ——单击鼠标左键 2 click_and_hold(on_element=None) ——点击鼠标左键,不松开 3 context_click(on_element=None) ——点击鼠标右键 4 double_click(on_element=None) ——双击鼠标左键 5 drag_and_drop(source, target... 阅读全文
posted @ 2019-06-18 17:24 屁桃 阅读(802) 评论(0) 推荐(0) 编辑
摘要: 1 from hashlib import md5 2 from selenium import webdriver 3 import time 4 import requests 5 from selenium.webdriver import ActionChains 6 from PIL im 阅读全文
posted @ 2019-06-18 12:13 屁桃 阅读(421) 评论(0) 推荐(0) 编辑
摘要: 一.创建数据表 # ORM中的数据表是什么呢? # Object Relation Mapping # Object - Table 通过 Object 去操纵数据表 # 从而引出了我们的第一步创建数据表 - 创建Object # 1. 创建Object # class User(object): 阅读全文
posted @ 2019-06-12 08:55 屁桃 阅读(2828) 评论(1) 推荐(1) 编辑
摘要: import threading class Test(object): from threading import Lock lock = Lock() flag = None def __new__(cls, *args, **kwargs): with cls.lock: if cls.flag ... 阅读全文
posted @ 2019-05-30 18:59 屁桃 阅读(245) 评论(0) 推荐(0) 编辑
摘要: 通常在进行网络数据采集时候我们会用到requests,urllib等模块,但是这些模块在使用中并不支持异步,所以今天我们介绍一个支持异步网络请求的模块aiohttp. 首先我们使用flask简单的搭一个服务器: 下面是通过aiohttp进行的异步访问 : 结果 : i am xiaoming i a 阅读全文
posted @ 2019-05-07 20:39 屁桃 阅读(383) 评论(0) 推荐(0) 编辑
摘要: 首先来了解几个概念 : event_loop:事件循环,相当于一个无限循环,我们可以把一些函数注册到这个事件循环上,当满足某些条件的时候,函数就会被循环执行。程序是按照设定的顺序从头执行到尾,运行的次数也是完全按照设定。当在编写异步程序时,必然其中有部分程序的运行耗时是比较久的,需要先让出当前程序的 阅读全文
posted @ 2019-05-06 22:06 屁桃 阅读(358) 评论(1) 推荐(1) 编辑
摘要: selenium是用来完成浏览器自动化相关的操作.可以通过代码的形式制定一些基于浏览器自动化的相关操作(行为动作),当代码执行后,浏览器就会自动触发相关的事件.但这并不能避免服务器的检测.当在浏览器中打开开发者工具输入window.navigator.webdriver时会显示true,说明被服务器 阅读全文
posted @ 2019-05-06 21:02 屁桃 阅读(5759) 评论(9) 推荐(3) 编辑
摘要: 实现查看所有文件,重点在于文件夹下又有文件夹时怎样处理,这里通过os模块来解决. 方法一 : 通过递归实现遍历所有文件夹 方法二 : 通过walk方法实现 阅读全文
posted @ 2019-05-06 20:05 屁桃 阅读(20975) 评论(0) 推荐(2) 编辑
摘要: from selenium import webdriver import requests,os from lxml import etree from selenium.webdriver.chrome.options import Options from urllib import request chrome_options = Options() chrome_options.ad... 阅读全文
posted @ 2019-05-06 17:51 屁桃 阅读(274) 评论(0) 推荐(0) 编辑
摘要: import http.client, mimetypes, urllib, json, time, requests ###################################################################### class YDMHttp: apiurl = 'http://api.yundama.com/api.php' ... 阅读全文
posted @ 2019-05-05 17:38 屁桃 阅读(1150) 评论(0) 推荐(1) 编辑
摘要: django的请求生命周期 : 每个请求都会经过中间件,如果请求在中间件中被打断,则不会走除中间件外的步骤.参考 https://www.cnblogs.com/wangtaobiu/p/10726332.html 阅读全文
posted @ 2019-04-17 21:59 屁桃 阅读(149) 评论(0) 推荐(0) 编辑
摘要: 一.什么是中间件 "Middleware is a framework of hooks into Django’s request/response processing. It’s a light, low-level “plugin” system for globally altering 阅读全文
posted @ 2019-04-17 21:29 屁桃 阅读(166) 评论(0) 推荐(0) 编辑
摘要: 工作区: 当前的编辑位置 缓存区: add 之后的区域 版本库: commit之后的区域就是版本库 git init . 初始化 git add . 将工作区的所有文件添加到缓存区 git commit -m “提交信息” 将缓存区的内容添加到版本库 git status 查看当前的状态 git r 阅读全文
posted @ 2019-04-16 19:32 屁桃 阅读(228) 评论(0) 推荐(0) 编辑