摘要: Beautiful Soup库的中文文档: https://www.crummy.com/software/BeautifulSoup/bs4/doc/index.zh.html# [A] Beautiful Soup库简介 Beautiful Soup库,也叫 beautifulsoup4 库 或 阅读全文
posted @ 2020-11-16 22:27 CarreyB 阅读(153) 评论(0) 推荐(0) 编辑
摘要: [A] 京东商品页面的爬取 代码示例: import requests url = 'https://item.jd.com/70076567438.html' try: r = requests.get(url) r.raise_for_status() r.encoding = r.appare 阅读全文
posted @ 2020-11-16 12:15 CarreyB 阅读(139) 评论(0) 推荐(0) 编辑
摘要: [A] 网络爬虫引发的问题 1. 当前网络爬虫根据规模可分为三种: 1. 小型规模,主要用于爬取网页,玩转网页,数据量小,并且对于爬取速度不敏感,这种爬虫可以直接通过Python提供的第三方库Requests即可实现 2. 中等规模,主要用于爬取网站,系列网站,数据量大,并且对于爬取速度有敏感性,如 阅读全文
posted @ 2020-11-16 10:23 CarreyB 阅读(125) 评论(0) 推荐(0) 编辑