随笔分类 - Python爬虫

python爬虫多次请求超时的几种重试方法

摘要：第一种方法总结：代码比较冗余，重试try的次数越多，代码行数越多，但是打印日志比较方便第二种方法总结：遍历代码明显比第一个简化了很多，打印日志也方便第三种方法总结：迭代显得比较高大上，中间处理代码时有其它错误照样可以进行重试；缺点不太好理解，容易出错，另外try包含的内容过多时阅读全文

posted @ 2020-05-08 23:47 莫贞俊晗阅读(4708) 评论(0) 推荐(0) 编辑

python3 工作上一些正则表达式

摘要：##Python3 replace()方法 ###实例1 def main(): text = 'python3, word!' text1 = text.replace('python3', 'Hello') print(text1) if __name__ == '__main__': main 阅读全文

posted @ 2020-04-10 19:12 莫贞俊晗阅读(650) 评论(0) 推荐(0) 编辑

python3多线程爬取京东投诉信息

摘要：开启线程池示例一、多线程爬取京东投诉信息 20页数据爬取时间：Done, Time cost: 1.6854908466339111 二、多线程爬取阿里详情投诉信息 20页数据爬取时间：Done, Time cost: 20.348562240600586 阅读全文

posted @ 2020-03-22 22:21 莫贞俊晗阅读(308) 评论(0) 推荐(0) 编辑

爬虫最新的库requests-html库总结

摘要：爬虫最新的库requests html库总结 requests html是比较新的爬虫库,作者和requests是同一个作者一.安装依赖我们可以在安装的时候看到他安装了lxml,reuqests,bs4......我们常用的解析和爬取的库都分装在他里面二. 发起请求 1.解决无头浏览器(针对反阅读全文

posted @ 2020-03-20 14:31 莫贞俊晗阅读(1020) 评论(0) 推荐(0) 编辑

python3爬取东方财富股东户数2013-2019年数据

摘要：``` python!/usr/bin/env python -*- coding:utf-8 -*-import reimport csvimport timeimport randomimport requestsimport jsonfrom bokeh.models import pdfrom requests import sessionclass spider_DongFangCaiF... 阅读全文

posted @ 2020-02-17 22:58 莫贞俊晗阅读(1559) 评论(0) 推荐(0) 编辑

公告

昵称：莫贞俊晗
园龄： 5年2个月
粉丝： 49
关注： 8

+加关注

2025年3月

日

一

二

三

四

五

六

莫贞俊晗

随笔分类 - Python爬虫

公告

搜索

常用链接

我的标签

随笔分类

随笔档案

阅读排行榜

评论排行榜

推荐排行榜

最新评论