骑骡子赶猪  

2019年8月2日

摘要: 安装 各浏览器User-Agent的值 实用性 写到这里大家会发现写爬虫最实用的是可以随意变换headers,一定要有随机性。在这里我写了三个随机生成user agent,三次打印都不一样,随机性很强,十分方便。 爬虫中具体使用方法 1. UserAgent 模块使用 1 2 3 4 5 6 fro 阅读全文
posted @ 2019-08-02 09:16 骑骡子赶猪 阅读(2575) 评论(0) 推荐(0) 编辑

2019年7月25日

摘要: 1.先下载teamviewer (官网自己搜) 2.安装: 然后 傻瓜安装 建议 选择公司/商务用途 3.安装好之后 会有试用, 试用 7天后 感觉好用就可以直接 买许可证 功能强大 若感觉不是那么好用 你可以 试试用 qq的 远程 毕竟 用qq 还是很方便的 还不需要下载这破玩意 一切看自己 若不 阅读全文
posted @ 2019-07-25 11:35 骑骡子赶猪 阅读(181) 评论(0) 推荐(0) 编辑

2019年7月24日

摘要: #利用pandas 中的read_html 获取页面表格import pandas as pdimport requests# 爬取网址headers = { "User-Agent": "Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 阅读全文
posted @ 2019-07-24 13:36 骑骡子赶猪 阅读(546) 评论(0) 推荐(0) 编辑

2019年7月17日

摘要: heapq模块 heapq模块中有两个函数--nlargest和nsmallest可以找到列表,元祖,集合等数据结构中的最大或最小的n个元素,并以列表的形式返回 import heapq nums = {1, 8, 9, 41, 5, 6, -5, 21, 42, 37, 2} # nums = [ 阅读全文
posted @ 2019-07-17 13:14 骑骡子赶猪 阅读(144) 评论(0) 推荐(0) 编辑

2019年5月31日

摘要: linux 1. 下载tesseract-ocr源码 git clone -b master https://github.com/tesseract-ocr/tesseract.git tesseract-ocr 2. 安装g++ yum install gcc gcc-c++ make 3. 安 阅读全文
posted @ 2019-05-31 11:55 骑骡子赶猪 阅读(853) 评论(0) 推荐(0) 编辑

2019年5月22日

摘要: Exceptions(异常)Python 自带的异常,所有异常的基类。 异常: selenium.common.exceptions.ElementNotSelectableException(msg=None, screen=None, stacktrace=None) 依据: selenium. 阅读全文
posted @ 2019-05-22 15:51 骑骡子赶猪 阅读(112) 评论(0) 推荐(0) 编辑

2019年4月21日

摘要: 作用 生成项目所使用的第三方模块及版本号的文件 根据文件安装第三方模块 安装 1 pip install pipreqs 1 pip install pipreqs 1 pip install pipreqs 1 pip install pipreqs pip install pipreqs 生成依 阅读全文
posted @ 2019-04-21 10:43 骑骡子赶猪 阅读(183) 评论(0) 推荐(0) 编辑

2019年4月20日

摘要: # 导入相关的库from PIL import Image# 打开一张图img = Image.open('.\longzhong.png')# 图片尺寸img_size = img.sizeh = img_size[1] # 图片高度w = img_size[0] # 图片宽度print(h,w) 阅读全文
posted @ 2019-04-20 22:19 骑骡子赶猪 阅读(130) 评论(0) 推荐(0) 编辑

2019年4月18日

摘要: # 时间戳转换为格式化 import time timeStamp = 1570695095 timeArray = time.localtime(timeStamp) otherStyleTime = time.strftime("%Y--%m--%d %H:%M:%S", timeArray) 阅读全文
posted @ 2019-04-18 15:34 骑骡子赶猪 阅读(96) 评论(0) 推荐(0) 编辑

2019年4月3日

摘要: from PIL import Imagefrom selenium import webdriverfrom selenium.webdriver import ActionChainsfrom selenium.webdriver.common.by import Byfrom selenium 阅读全文
posted @ 2019-04-03 17:31 骑骡子赶猪 阅读(263) 评论(0) 推荐(0) 编辑