05 2020 档案
摘要:一、什么是PhantomJS? 一款无界面浏览器。 二、python如何爬取动态加载页面? selenium+PhantomJS(爬虫终极解决方案) 三、selenium操作PhantomJS 1、下载PhantomJS https://phantomjs.org/download.html 2、代
阅读全文
摘要:一、问题描述 使用find_elements_by_class_name定位元素有时候会出现打印出来的列表里面数据为空的现象,导致定位不到具体的元素。 二、解决方案 在前面加延时:time.sleep(2)
阅读全文
摘要:一、什么是selenium? 它是一个python的第三方库,对外提供的接口可以操作你的浏览器,然后让浏览器完成自动化操作。 二、使用selenium 1、安装 pip3 install selenium 2、操作谷歌浏览器 首先安装谷歌浏览器驱动,chromedriver,驱动的版本要与谷歌浏览器
阅读全文
摘要:一、首先Safari浏览器调出开发者模式 二、iPhone手机需要在设置-safari浏览器--高级里面开启‘页面检查器’选项 三、手机上在safari浏览器打开指定的网页 四、在电脑端找到连接电脑的手机进入手机端打开的网页 注意:iphone手机上必须要有开发者模式
阅读全文
摘要:一、问题描述 安装了android sdk 配置了系统环境变量,在命令行运行adb devices,没有展示设备,如下图: 二、出现问题的原因 1、驱动列表里面没有驱动信息。 2、android SDK安装的有问题,部分内容没有安装(比如可能是安装的版本高了,多安装几个版本,项目安装少了等)。 三、
阅读全文
摘要:一、问题描述 下载了android sdk,并且根据网上的环境变量配置步骤配置了sdk的环境变量,但是在命令窗口运行adb时还是提示:“adb”不是内部或外部命令,也不是可运行的程序或批处理文件 二、问题原因 android 2.2以后,adb.exe是放在SDK的platform-tools目录下
阅读全文
摘要:一、问题说明与解答 某些情况下想去掉字符串中的(),但是使用strip之后无法去掉,这是因为当前字符串的全面或者后面可能存在空格\换行\回车等字符串,因此在我们使用strip之前必须先去掉前面或者后面的空格。 二、实例 #!/usr/local/bin/python3.7 import re # 去
阅读全文
摘要:一、问题描述 python将时间戳转换为具体时间时,年显示的不对 二、出现问题的原因 时间戳分为10位秒时间戳和13位毫秒时间戳,在转换的时候将13位时间戳当作10位时间戳来处理了。 三、解决方案 13位时间戳在转换的时候需要/1000(10位不需要) 即如下代码:
阅读全文
摘要:一、问题描述 python爬取下来的json数据中中文是十六进制的 二、出现问题的原因 这是因为中文以 unicode 编码了,而默认是以ASCII解析的,中文不在ASCII编码中,所以无法显示。 三、解决方案 将请求到的数据进行如下处理即可,data是json字符串 四、处理后的结果
阅读全文
摘要:一、问题描述 python爬虫爬取网上数据时报错:urllib.error.URLError: <urlopen error [SSL: CERTIFICATE_VERIFY_FAILED] certificate verify failed: self signed certificate in
阅读全文
摘要:一、问题描述 导入某一模块,执行程序报错:TypeError: 'module' object is not callable 二、报错原因 你自定义的py文件名与导入的模块名重复了。 三、解决方案 修改自己定义的py文件名,避免与导入的模块名一致。
阅读全文
摘要:一、什么是jsonpath 用来解析json数据的所使用的。 二、拓展 1、python 处理json格式所使用的函数 (1)json.dumps() 将字典或者列表转换为json格式的字符串。 (2)json.loads() 将json格式字符串转换为python对象。 (3)json.dump(
阅读全文
摘要:一、什么是懒加载技术? 用到的时候再加载,比如查看某个网站的图片,可视区内只能看到4张图片,如果需要查看后面的图片则需要滑动查看。 二、懒加载技术的实现 1、实现方式 <img src2='图片链接'>,即将img标签的src属性改为src2,当加载到这个图片时,才会动态变为src 2、演示说明 (
阅读全文
摘要:haoduanzi.py#!/usr/local/bin/python3.7 import urllib.request import urllib.parse from lxml import etree import time def handler_request(url, page): #
阅读全文
摘要:一、问题描述 使用xpath对象打开本地html文件报错:Opening and ending tag mismatch: meta line 5 and head, line 7, column 8解决方案 二、解决方案 在html文件中meta标签的后面加斜杠,如下图:
阅读全文