会员
周边
众包
新闻
博问
闪存
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
骑骡子赶猪
公告
日历
导航
博客园
首页
新随笔
新文章
联系
订阅
管理
上一页
1
2
3
4
5
6
7
下一页
2019年8月2日
from fake_useragent import UserAgent
摘要: 安装 各浏览器User-Agent的值 实用性 写到这里大家会发现写爬虫最实用的是可以随意变换headers,一定要有随机性。在这里我写了三个随机生成user agent,三次打印都不一样,随机性很强,十分方便。 爬虫中具体使用方法 1. UserAgent 模块使用 1 2 3 4 5 6 fro
阅读全文
posted @ 2019-08-02 09:16 骑骡子赶猪
阅读(2521)
评论(0)
推荐(0)
编辑
2019年7月25日
teamviewer 安装 仅学习
摘要: 1.先下载teamviewer (官网自己搜) 2.安装: 然后 傻瓜安装 建议 选择公司/商务用途 3.安装好之后 会有试用, 试用 7天后 感觉好用就可以直接 买许可证 功能强大 若感觉不是那么好用 你可以 试试用 qq的 远程 毕竟 用qq 还是很方便的 还不需要下载这破玩意 一切看自己 若不
阅读全文
posted @ 2019-07-25 11:35 骑骡子赶猪
阅读(180)
评论(0)
推荐(0)
编辑
2019年7月24日
利用pandas 中的read_html 获取页面表格
摘要: #利用pandas 中的read_html 获取页面表格import pandas as pdimport requests# 爬取网址headers = { "User-Agent": "Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36
阅读全文
posted @ 2019-07-24 13:36 骑骡子赶猪
阅读(531)
评论(0)
推荐(0)
编辑
2019年7月17日
heapq
摘要: heapq模块 heapq模块中有两个函数--nlargest和nsmallest可以找到列表,元祖,集合等数据结构中的最大或最小的n个元素,并以列表的形式返回 import heapq nums = {1, 8, 9, 41, 5, 6, -5, 21, 42, 37, 2} # nums = [
阅读全文
posted @ 2019-07-17 13:14 骑骡子赶猪
阅读(136)
评论(0)
推荐(0)
编辑
2019年5月31日
pytesseract 用法
摘要: linux 1. 下载tesseract-ocr源码 git clone -b master https://github.com/tesseract-ocr/tesseract.git tesseract-ocr 2. 安装g++ yum install gcc gcc-c++ make 3. 安
阅读全文
posted @ 2019-05-31 11:55 骑骡子赶猪
阅读(808)
评论(0)
推荐(0)
编辑
2019年5月22日
selenium 异常
摘要: Exceptions(异常)Python 自带的异常,所有异常的基类。 异常: selenium.common.exceptions.ElementNotSelectableException(msg=None, screen=None, stacktrace=None) 依据: selenium.
阅读全文
posted @ 2019-05-22 15:51 骑骡子赶猪
阅读(110)
评论(0)
推荐(0)
编辑
2019年4月21日
项目包管理
摘要: 作用 生成项目所使用的第三方模块及版本号的文件 根据文件安装第三方模块 安装 1 pip install pipreqs 1 pip install pipreqs 1 pip install pipreqs 1 pip install pipreqs pip install pipreqs 生成依
阅读全文
posted @ 2019-04-21 10:43 骑骡子赶猪
阅读(180)
评论(0)
推荐(0)
编辑
2019年4月20日
裁剪图片
摘要: # 导入相关的库from PIL import Image# 打开一张图img = Image.open('.\longzhong.png')# 图片尺寸img_size = img.sizeh = img_size[1] # 图片高度w = img_size[0] # 图片宽度print(h,w)
阅读全文
posted @ 2019-04-20 22:19 骑骡子赶猪
阅读(126)
评论(0)
推荐(0)
编辑
2019年4月18日
时间处理
摘要: # 时间戳转换为格式化 import time timeStamp = 1570695095 timeArray = time.localtime(timeStamp) otherStyleTime = time.strftime("%Y--%m--%d %H:%M:%S", timeArray)
阅读全文
posted @ 2019-04-18 15:34 骑骡子赶猪
阅读(93)
评论(0)
推荐(0)
编辑
2019年4月3日
yidun验证码
摘要: from PIL import Imagefrom selenium import webdriverfrom selenium.webdriver import ActionChainsfrom selenium.webdriver.common.by import Byfrom selenium
阅读全文
posted @ 2019-04-03 17:31 骑骡子赶猪
阅读(256)
评论(0)
推荐(0)
编辑
上一页
1
2
3
4
5
6
7
下一页
Copyright © 2024 骑骡子赶猪
Powered by .NET 8.0 on Kubernetes