Fork me on GitHub

随笔分类 -  Python学习 / Python爬虫学习

摘要:Requests请求库 Requests 是⽤Python语⾔编写,基于urllib,采⽤Apache2 Licensed开源协议的 HTTP 库。它⽐ urllib 更加⽅便,可以节约我们⼤量的⼯作,完全满⾜HTTP测试需求。 ⼀句话——Python实现的简单易⽤的HTTP库 1. 了解reque 阅读全文
posted @ 2023-05-18 20:31 慧眼识辰 阅读(189) 评论(0) 推荐(0) 编辑
摘要:我们这次使用Python来进行对酷狗音乐的爬取,数据来源与酷狗 1.发送请求的模块 import requests 音乐的地址URL m_url = 'https://webfs.ali.kugou.com/202305172335/695e4719686e024397958a7eb3f7d89c/ 阅读全文
posted @ 2023-05-18 10:00 慧眼识辰 阅读(1187) 评论(0) 推荐(0) 编辑
摘要:1.通过requests拿到网页的源代码数据导入requests和etree模块 import requestsfrom lxml import etree 2.通过lxml通过对源代码数据进行解析,拿到照片的URL地址 首先进行发送请求,获取URL index_url = 'https://tie 阅读全文
posted @ 2023-05-17 15:54 慧眼识辰 阅读(39) 评论(0) 推荐(0) 编辑
摘要:1、Requests模块说明 Requests 是使用 Apache2 Licensed 许可证的 HTTP 库。用 Python 编写,真正的为人类着想。 Python 标准库中的 urllib2 模块提供了你所需要的大多数 HTTP 功能,但是它的 API 太渣了。它是为另一个时代、另一个互联网 阅读全文
posted @ 2023-05-17 14:55 慧眼识辰 阅读(77) 评论(0) 推荐(0) 编辑
摘要:正则表达式 regular expression 简称“RE”正则表达式是用来简洁表达一组字符串的表达式。 ‘PY’‘PYY’‘PYYYYY…’正则表达式:PY+ ‘PY’开头,后续存在不多于10个字符,后续字符不能是‘P’或‘Y’‘PYABC’ √‘PYKXYZ’ ×正则表达式:PY[^PY]{0 阅读全文
posted @ 2023-05-15 20:31 慧眼识辰 阅读(304) 评论(0) 推荐(0) 编辑

1
点击右上角即可分享
微信分享提示