公告

12 2019 档案

摘要：1、目标地址 http://quotes.toscrape.com 将页面的文章内容和作者爬下来，并保存到json文件里面。下面代码：用到的工具：scrapy ,xpath选择器，json，codecs编码爬虫代码： class ScrapeSpider(scrapy.Spider): nam 阅读全文

posted @ 2019-12-09 15:43 夜雨JC 阅读(354) 评论(0) 推荐(0) 编辑

Python beautifulsoup4 快速入门

摘要：快速开始下面的一段HTML代码将作为例子被多次用到.这是爱丽丝梦游仙境的的一段内容(以后内容中简称为爱丽丝的文档): html_doc = """ <html><head><title>The Dormouse's story</title></head> <body> <p class= 阅读全文

posted @ 2019-12-04 11:11 夜雨JC 阅读(1823) 评论(0) 推荐(0) 编辑

Python Requests 高级用法

摘要：会话对象会话对象让你能够跨请求保持某些参数。它也会在同一个 Session 实例发出的所有请求之间保持 cookie，期间使用 urllib3 的 connection pooling 功能。所以如果你向同一主机发送多个请求，底层的 TCP 连接将会被重用，从而带来显著的性能提升。 (参见 HT 阅读全文

posted @ 2019-12-04 11:04 夜雨JC 阅读(1919) 评论(0) 推荐(0) 编辑

Python Requests库快速入门

摘要：发送请求使用 Requests 发送网络请求非常简单。一开始要导入 Requests 模块： >>> import requests 然后，尝试获取某个网页。本例子中，我们来获取 Github 的公共时间线： >>> r = requests.get('https://api.github.co 阅读全文

posted @ 2019-12-04 11:03 夜雨JC 阅读(204) 评论(0) 推荐(0) 编辑

linux 高并发事件触发处理 — epoll

posted @ 2019-12-04 10:14 夜雨JC 阅读(511) 评论(0) 推荐(0) 编辑

初识Python爬妹子图片

摘要：1、地址 http://www.jder.net/meizi/ 代码： #!/usr/bin/python3.6 # -*- coding: utf-8 -*- import requests from bs4 import BeautifulSoup import codecs import ti 阅读全文

posted @ 2019-12-04 10:14 夜雨JC 阅读(235) 评论(0) 推荐(0) 编辑