摘要: import json import requests from requests.exceptions import RequestException import re import time def get_one_page(url): try: headers = { 'User-Agent': 'Mozilla/5.0 (Macint... 阅读全文
posted @ 2018-10-30 13:40 东东欧尼酱 阅读(409) 评论(0) 推荐(0) 编辑
摘要: 堆(英语:heap)是计算机科学中一类特殊的数据结构的统称。堆通常是一个可以被看做一棵树的数组对象。堆总是满足下列性质: 堆中某个节点的值总是不大于或不小于其父节点的值; 堆总是一棵完全二叉树。 将根节点最大的堆叫做最大堆或大根堆,根节点最小的堆叫做最小堆或小根堆。 堆(英语:heap)是计算机科学 阅读全文
posted @ 2018-10-30 13:39 东东欧尼酱 阅读(151) 评论(0) 推荐(0) 编辑
摘要: html = lxml.etree.HTML(text)#使用text构造一个XPath解析对象,etree模块可以自动修正HTML文本 html = lxml.etree.parse('./ex.html',etree.HTMLParser())#直接读取文本进行解析 from lxml impo 阅读全文
posted @ 2018-10-30 13:38 东东欧尼酱 阅读(1638) 评论(0) 推荐(0) 编辑