骑骡子赶猪 |
|
||
2019年8月2日
摘要:
安装 各浏览器User-Agent的值 实用性 写到这里大家会发现写爬虫最实用的是可以随意变换headers,一定要有随机性。在这里我写了三个随机生成user agent,三次打印都不一样,随机性很强,十分方便。 爬虫中具体使用方法 1. UserAgent 模块使用 1 2 3 4 5 6 fro 阅读全文
2019年7月25日
摘要:
1.先下载teamviewer (官网自己搜) 2.安装: 然后 傻瓜安装 建议 选择公司/商务用途 3.安装好之后 会有试用, 试用 7天后 感觉好用就可以直接 买许可证 功能强大 若感觉不是那么好用 你可以 试试用 qq的 远程 毕竟 用qq 还是很方便的 还不需要下载这破玩意 一切看自己 若不 阅读全文
2019年7月24日
摘要:
#利用pandas 中的read_html 获取页面表格import pandas as pdimport requests# 爬取网址headers = { "User-Agent": "Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 阅读全文
2019年7月17日
摘要:
heapq模块 heapq模块中有两个函数--nlargest和nsmallest可以找到列表,元祖,集合等数据结构中的最大或最小的n个元素,并以列表的形式返回 import heapq nums = {1, 8, 9, 41, 5, 6, -5, 21, 42, 37, 2} # nums = [ 阅读全文
2019年5月31日
摘要:
linux 1. 下载tesseract-ocr源码 git clone -b master https://github.com/tesseract-ocr/tesseract.git tesseract-ocr 2. 安装g++ yum install gcc gcc-c++ make 3. 安 阅读全文
2019年5月22日
摘要:
Exceptions(异常)Python 自带的异常,所有异常的基类。 异常: selenium.common.exceptions.ElementNotSelectableException(msg=None, screen=None, stacktrace=None) 依据: selenium. 阅读全文
2019年4月21日
摘要:
作用 生成项目所使用的第三方模块及版本号的文件 根据文件安装第三方模块 安装 1 pip install pipreqs 1 pip install pipreqs 1 pip install pipreqs 1 pip install pipreqs pip install pipreqs 生成依 阅读全文
2019年4月20日
摘要:
# 导入相关的库from PIL import Image# 打开一张图img = Image.open('.\longzhong.png')# 图片尺寸img_size = img.sizeh = img_size[1] # 图片高度w = img_size[0] # 图片宽度print(h,w) 阅读全文
2019年4月18日
摘要:
# 时间戳转换为格式化 import time timeStamp = 1570695095 timeArray = time.localtime(timeStamp) otherStyleTime = time.strftime("%Y--%m--%d %H:%M:%S", timeArray) 阅读全文
2019年4月3日
摘要:
from PIL import Imagefrom selenium import webdriverfrom selenium.webdriver import ActionChainsfrom selenium.webdriver.common.by import Byfrom selenium 阅读全文
|
Copyright © 2024 骑骡子赶猪
Powered by .NET 9.0 on Kubernetes |