摘要: 如果不改变header,往往只能获取到很少一部分的content。所以我们要改变header import requests respones = requests.get("https://www.baidu.com") print(respones.status_code) print(resp 阅读全文
posted @ 2020-07-03 11:49 SunCY 阅读(2708) 评论(0) 推荐(0) 编辑
摘要: ![](https://img2020.cnblogs.com/blog/1724342/202007/1724342-20200703095548307-272193960.png)![](https://img2020.cnblogs.com/blog/1724342/202007/1724342-20200703095605740-2141259811.png)![](https://img... 阅读全文
posted @ 2020-07-03 11:44 SunCY 阅读(134) 评论(0) 推荐(0) 编辑
摘要: ![](https://img2020.cnblogs.com/blog/1724342/202007/1724342-20200703100705142-144313380.png)![](https://img2020.cnblogs.com/blog/1724342/202007/1724342-20200703100943629-485341444.png)![](https://img2... 阅读全文
posted @ 2020-07-03 10:15 SunCY 阅读(98) 评论(0) 推荐(0) 编辑
摘要: 爬虫的分类 ● 通用爬虫:通常指搜索引|擎的爬虫 聚焦爬虫:针对特定网站的爬虫 阅读全文
posted @ 2020-07-03 09:23 SunCY 阅读(113) 评论(0) 推荐(0) 编辑
摘要: GET / HTTP/1.1 Host: www . baidu . com Connection: keep- alive Cache- Control: max- age=0 Upgrade Insecure Requests: 1 User-Agent: Mozilla/5.0 (Window 阅读全文
posted @ 2020-07-03 08:54 SunCY 阅读(712) 评论(0) 推荐(0) 编辑
摘要: #HI ##HI ###HI ####HI #####HI ######HI 引用测试 加粗测试 SCY **SCY** 语言测试 阅读全文
posted @ 2020-07-03 07:11 SunCY 阅读(92) 评论(0) 推荐(0) 编辑
摘要: ■HTTP ●超文本传输协议 ●默认端口号:80■HTTPS ●HTTP + SSL (安全套接字层) ●默认端口号: 443HTTPS比HTTP更安全,但是性能更低 阅读全文
posted @ 2020-07-03 06:45 SunCY 阅读(138) 评论(0) 推荐(0) 编辑
摘要: 字符串的类型 ●bytes: 二进制 互联网.上数据的都是以二进制的方式传输的 ●str : unicode的呈现形式 字符(Cheracter)是各种文字和符号的总称,包括各国家文字、标点符号、图形符号、数字等 字符集(Character set)是多个字符的集合 字符集包括: ASCII字符集、 阅读全文
posted @ 2020-07-03 06:40 SunCY 阅读(144) 评论(0) 推荐(0) 编辑