随笔分类 -  Python爬虫

摘要:老样子,先上最后成功源码(在D盘下创建'好看视频'文件夹,直接运行即可获取视频): import sys import re,os import requests from you_get import common as you_get def getVideo(url,path,headers) 阅读全文
posted @ 2020-06-20 10:29 塔克拉玛攻城狮 阅读(11875) 评论(0) 推荐(2) 编辑
摘要:爬取网站:第一PPT(http://www.1ppt.com/) 此网站真的良心 老样子,先上最后成功的源码(在D盘创建一个"D:\PPT"文件夹,直接将代码执行就可获取到PPT): import requests import urllib import os from bs4 import Be 阅读全文
posted @ 2020-03-16 12:50 塔克拉玛攻城狮 阅读(6490) 评论(1) 推荐(0) 编辑
摘要:经过上一期爬取豆瓣影评成功后,感觉爬虫还不错,于是想爬点图片来玩玩... 搜狗图片地址:https://pic.sogou.com/?from=category 先上最后成功的源码(在D盘下创建souGouImg文件夹,直接直接代码即可获取): import requests import urll 阅读全文
posted @ 2020-03-16 12:42 塔克拉玛攻城狮 阅读(2328) 评论(0) 推荐(0) 编辑
摘要:豆瓣网站:https://movie.douban.com/chart 先上最后的代码: from bs4 import BeautifulSoup from lxml import html import xml import requests from fake_useragent import 阅读全文
posted @ 2020-03-16 12:35 塔克拉玛攻城狮 阅读(1459) 评论(0) 推荐(0) 编辑
摘要:1、requests库 http协议中,最常用的就是GET方法: import requests response = requests.get('http://www.baidu.com') print(response.status_code) # 打印状态码 print(response.ur 阅读全文
posted @ 2020-03-16 12:02 塔克拉玛攻城狮 阅读(3752) 评论(0) 推荐(1) 编辑

more_horiz
keyboard_arrow_up dark_mode palette
选择主题
点击右上角即可分享
微信分享提示