摘要: 如下,爬取 http://tieba.baidu.com/p/4229162765 这个页面的图片并下载到桌面的 images 文件夹下: 阅读全文
posted @ 2019-02-13 23:52 孔雀东南飞 阅读(172) 评论(0) 推荐(0) 编辑
摘要: urllib2.urlopen(url, data=None, timeout=<object object>) :用于打开一个URL,URL可以是一个字符串也可以是一个请求对象,data 用于指定要发送到服务器的额外数据的字符串,timeout 用于设置打开URL的超时时间 urllib2.Req 阅读全文
posted @ 2019-02-13 23:14 孔雀东南飞 阅读(2390) 评论(0) 推荐(0) 编辑
摘要: 爬虫介绍 爬取图片 爬取文本 爬虫相关模块:re 爬虫相关模块:urllib 爬虫相关模块:urllib2 爬虫相关模块:cookielib 爬虫相关模块:requests 爬取需要登录的页面 阅读全文
posted @ 2019-02-13 17:29 孔雀东南飞 阅读(224) 评论(0) 推荐(0) 编辑
摘要: ulimit命令用来限制系统用户对 shell 资源的访问,常见用法如下: 命令参数: 命令输出: 线上的用法: 阅读全文
posted @ 2019-02-13 09:45 孔雀东南飞 阅读(335) 评论(0) 推荐(0) 编辑