Loading

摘要: 爬取网站:第一PPT(http://www.1ppt.com/) 此网站真的良心 老样子,先上最后成功的源码(在D盘创建一个"D:\PPT"文件夹,直接将代码执行就可获取到PPT): import requests import urllib import os from bs4 import Be 阅读全文
posted @ 2020-03-16 12:50 塔克拉玛攻城狮 阅读(6375) 评论(1) 推荐(0) 编辑
摘要: 经过上一期爬取豆瓣影评成功后,感觉爬虫还不错,于是想爬点图片来玩玩... 搜狗图片地址:https://pic.sogou.com/?from=category 先上最后成功的源码(在D盘下创建souGouImg文件夹,直接直接代码即可获取): import requests import urll 阅读全文
posted @ 2020-03-16 12:42 塔克拉玛攻城狮 阅读(2263) 评论(0) 推荐(0) 编辑
摘要: 豆瓣网站:https://movie.douban.com/chart 先上最后的代码: from bs4 import BeautifulSoup from lxml import html import xml import requests from fake_useragent import 阅读全文
posted @ 2020-03-16 12:35 塔克拉玛攻城狮 阅读(1425) 评论(0) 推荐(0) 编辑
摘要: 1、requests库 http协议中,最常用的就是GET方法: import requests response = requests.get('http://www.baidu.com') print(response.status_code) # 打印状态码 print(response.ur 阅读全文
posted @ 2020-03-16 12:02 塔克拉玛攻城狮 阅读(3685) 评论(0) 推荐(1) 编辑