Python爬虫 - 随笔分类 - ZhuGaochao

摘要：参考：https://www.jianshu.com/p/f371120a1426 阅读全文

posted @ 2020-04-26 22:47 ZhuGaochao 阅读(303) 评论(0) 推荐(0)

selenium 报错： WebDriverException: Message: chrome not reachable

摘要：报错截图报错原因根据提示，是因为没找到chromedriver，最后经过调试，原来我 '/usr/local/bin/chromedriver' 下的driver有问题，就重新下载个driver，解压到我 /home/v-gazh/Apps 目录下：然后再执行代码，就OK了：阅读全文

posted @ 2020-04-26 22:35 ZhuGaochao 阅读(7239) 评论(0) 推荐(0)

requests 中response如何改变编码格式

摘要：查看初始编码首先查看拿到的response编码格式：（就不放代码了，因为此例需要用到cookie，可自行找个网站具体测试）可见初始编码为：ISO-8859-1 修改编码初始编码：修改后编码： so 修改编码后乱码消失了，你就可以对它为所欲为了~ 阅读全文

posted @ 2018-12-13 11:44 ZhuGaochao 阅读(2715) 评论(0) 推荐(0)

Selenium定位不到指定元素原因之iframe（unable to locate element）

摘要：浏览过程中，图片中的内容可能太小，无法看清，可以>右键>在新标签中打开 Outline 项目原因，需要用selenium实现模拟登陆、模拟上传文件，自然就需要模拟点击【上传】按钮；模拟点击之前需要通过selenium提供的“方法”去定位到要点击的元素；模拟登陆过程中，全程都可以定位到需要点击的元阅读全文

posted @ 2018-11-17 16:40 ZhuGaochao 阅读(6916) 评论(0) 推荐(0)

Scrapy(爬虫)基本运行机制

摘要：Scrapy(爬虫)基本运行机制阅读全文

posted @ 2018-05-14 19:59 ZhuGaochao 阅读(358) 评论(0) 推荐(0)

基于Requests和BeautifulSoup实现“自动登录”

摘要：基于Requests和BeautifulSoup实现“自动登录”实例自动登录抽屉新热榜 #!/usr/bin/env python # -*- coding:utf-8 -*- import requests # ############## 方式一 ############## """ # ## 阅读全文

posted @ 2018-05-11 20:22 ZhuGaochao 阅读(490) 评论(0) 推荐(0)

BeautifulSoup模块

摘要：介绍 BeautifulSoup是一个模块，该模块用于接收一个HTML或XML字符串，然后将其进行格式化，之后便可以使用他提供的方法进行快速查找指定元素，从而使得在HTML或XML中查找指定元素变得简单。安装使用示例详细使用方法 name：标签名称 attr：标签属性 children：所有子阅读全文

posted @ 2018-05-11 20:17 ZhuGaochao 阅读(249) 评论(0) 推荐(0)

Python爬虫之-Requests

摘要：Requests模块 Python标准库中提供了：urllib、urllib2、httplib等模块以供Http请求，但是，它的 API 太渣了。它是为另一个时代、另一个互联网所创建的。它需要巨量的工作，甚至包括各种方法覆盖，来完成最简单的任务。 Requests 是使用 Apache2 Lice 阅读全文

posted @ 2018-05-11 19:54 ZhuGaochao 阅读(311) 评论(0) 推荐(0)

TreeSir

Where You From & Where You Go.

随笔分类 - Python爬虫

公告