2020 年 3月 16 日随笔档案 - 塔克拉玛攻城狮

2020年3月16日

摘要：爬取网站：第一PPT（http://www.1ppt.com/）此网站真的良心老样子，先上最后成功的源码（在D盘创建一个"D:\PPT"文件夹，直接将代码执行就可获取到PPT）： import requests import urllib import os from bs4 import Be 阅读全文

posted @ 2020-03-16 12:50 塔克拉玛攻城狮阅读(6468) 评论(1) 推荐(0) 编辑

Python新手爬虫二：爬取搜狗图片（动态）

摘要：经过上一期爬取豆瓣影评成功后，感觉爬虫还不错，于是想爬点图片来玩玩... 搜狗图片地址：https://pic.sogou.com/?from=category 先上最后成功的源码（在D盘下创建souGouImg文件夹，直接直接代码即可获取）： import requests import urll 阅读全文

posted @ 2020-03-16 12:42 塔克拉玛攻城狮阅读(2316) 评论(0) 推荐(0) 编辑

Python新手爬虫一：爬取影片名称评分等

摘要：豆瓣网站：https://movie.douban.com/chart 先上最后的代码： from bs4 import BeautifulSoup from lxml import html import xml import requests from fake_useragent import 阅读全文

posted @ 2020-03-16 12:35 塔克拉玛攻城狮阅读(1453) 评论(0) 推荐(0) 编辑

Python爬虫常用库介绍（requests、BeautifulSoup、lxml、json）

摘要： 1、requests库 http协议中，最常用的就是GET方法： import requests response = requests.get('http://www.baidu.com') print(response.status_code) # 打印状态码 print(response.ur 阅读全文

posted @ 2020-03-16 12:02 塔克拉玛攻城狮阅读(3727) 评论(0) 推荐(1) 编辑

Loading

DevOps攻城狮

DevOps攻城狮，主要分享 Linux 操作系统、云原生及周边、DevOps运维开发相关技术。

公告