03 2019 档案

断言和简单unittest单元测试的入门代码整理
摘要:'''1.认识Assert 断言 断言的比较运算符号:assert可以使用比较运算:”==” “!=” ‘’<” “>” “>=” “<=”等符号来比较相等、不相等、小于、大于、大于等于和小于等于。 Assert 语法格式: assert 1 ==1 assert 2+2 ==2*2断言的作用: 1 阅读全文

posted @ 2019-03-14 11:22 我是夜雨吖 阅读(511) 评论(0) 推荐(0) 编辑

python爬虫之Xpath
摘要:了解XML 和xpath Xpath:http://www.w3school.com.cn/xpath/index.asp 安装库 Pip install lxml 什么是xpath Xml是用来存储和传输数据使用的 和html的不同有两点: Xpath用来在xml中查找指定的元素,它是一种路径表达 阅读全文

posted @ 2019-03-05 10:23 我是夜雨吖 阅读(322) 评论(0) 推荐(0) 编辑

python爬虫之bs4 美丽汤
摘要:beautifulsoup4 灵活又方便的网页解析库,处理高效,支持多种解析器。利用它不用编写正则表达式即可方便地实现网页的提取。 使用方法: 案例代码展示可不看 import requests from bs4 import * import re urls='https://www.dbmein 阅读全文

posted @ 2019-03-05 10:22 我是夜雨吖 阅读(1640) 评论(0) 推荐(0) 编辑

python3爬虫的模拟浏览器
摘要:爬虫的使用过程中,网站最简单的反爬虫就是验证发起请求的客户端是否为浏览器,因此需要爬虫模拟浏览器对网站发起请求。 这里介绍一个fake_useraent 1、伪造useragent字符串,每次请求都使用随机生成的useragen 为了减少复杂度,随机生成UA的功能通过第三方模块库fake-usera 阅读全文

posted @ 2019-03-05 10:20 我是夜雨吖 阅读(3895) 评论(0) 推荐(0) 编辑

python爬虫之requests库
摘要:什么是Requests? Requests 是用python语言编写,基于urllib,采用Apache2 Licensed 开源协议的HTTP库。它比urllib 更加方便,可以节约我们大量的工作,完全满足HTTP 测试需求。 一句话——python实现的简单易用的HTTP 库 Requests的 阅读全文

posted @ 2019-03-05 10:19 我是夜雨吖 阅读(340) 评论(0) 推荐(0) 编辑

导航

点击右上角即可分享
微信分享提示