12 2017 档案
摘要:原文链接:http://www.limerence2017.com/2017/12/28/python19/#more 介绍几个python中常见的第三方库. Pillow Pillow简称PIL,是python中常用的图形图像处理模块。写一个简单的例子 Image.open函数打开一张图片,然后调
阅读全文
摘要:转载自:原文链接 前几篇文章介绍了urllib库基本使用和爬虫的简单应用,本文介绍如何通过post信息给网站,保存登陆后cookie,并用于请求有权限的操作。保存cookie需要用到cookiejar类,可以输出cookie信息查看下 1 通过http.cookiejar.CookieJar()创建
阅读全文
摘要:这一篇巩固前几篇文章的学到的技术,利用urllib库爬取美女图片,其中采用了多线程,文件读写,目录匹配,正则表达式解析,字符串拼接等知识,这些都是前文提到的,综合运用一下,写个爬虫示例爬取美女图片。先定义几个匹配规则和User_Agent 读者可以根据不同网站的代码去修改这些规则,达到匹配一些网站的
阅读全文
摘要:原文链接:爬取糗事百科段子 利用前面学到的文件、正则表达式、urllib的知识,综合运用,爬取糗事百科的段子先用urllib库获取糗事百科热帖第一页的数据。并打开文件进行保存,正好可以熟悉一下之前学过的文件知识。 下面要用到学过的正则表达式的知识,过滤掉没有用的信息,只获取评论数,作者,正文,以及点
阅读全文
摘要:介绍python的几个內建模块,原文链接 1 python的时间模块datetime 取现在时间 将指定日期转化为时间戳 将时间戳转化为日期 根据时间戳转化为本地时间和utc时间 将字符串转化为时间 将时间戳转化为字符串 时间加减 设置时区 获取utc时区和时间,并且转化为别的时区的时间 2命名tu
阅读全文
摘要:原文链接 ## 什么是正则表达式`正则表达式是对字符串操作的一种逻辑公式,就是用事先定义好的一些特定字符、及这些特定字符的组合,组成一个“规则字符串”,这个“规则字符串”用来表达对字符串的一种过滤逻辑`## 正则表达式规则<!--more-->## 正则表达式注意问题### 数量词的贪婪模式与非贪婪
阅读全文