2018年12月29日

ubuntu下安装mysql

摘要: Ubantu18.0.4安装MySQL8.0方法: Ubantu18.0.4安装MySQL8.0方法: 1.首先,ubuntu安装mysql8.0(此版本比较好装),所以要先更新一下源,去MySQL官网http://dev.mysql.com/downloads/repo/apt/.下载一个mysq 阅读全文

posted @ 2018-12-29 18:54 泡8喝9耍10髦 阅读(346) 评论(0) 推荐(0) 编辑

2018年12月28日

ubuntu下安装nginx时依赖库zlib,pcre,openssl

摘要: 例如查看zlib是否安装: 例如查看zlib是否安装: 例如查看zlib是否安装: 例如查看zlib是否安装: dpkg -l | grep zlib 解决依赖包openssl安装,命令: sudo apt-get install openssl libssl-dev 解决依赖包pcre安装,命令: 阅读全文

posted @ 2018-12-28 15:03 泡8喝9耍10髦 阅读(133) 评论(0) 推荐(0) 编辑

2018年11月6日

Python是如何进行内存管理的?

摘要: 1.pyhton 是如何进行内存管理的 答:从三个方面来说,一对象的引用计数机制,二垃圾回收机制,三内存池机制 一、对象的引用计数机制 Python内部使用引用计数,来保持追踪内存中的对象,所有对象都有引用计数。 引用计数增加的情况: 1,一个对象分配一个新名称 2,将其放入一个容器中(如列表、元组 阅读全文

posted @ 2018-11-06 14:51 泡8喝9耍10髦 阅读(132) 评论(0) 推荐(0) 编辑

scrapy利用set()对数据进行去重

摘要: from scrapy.exceptions import DropItem #导入异常处理模块 class Baidu03Pipeline(object): def __init__(self): #建立构造方法 self.title = set() #定义集合 def process_item( 阅读全文

posted @ 2018-11-06 14:22 泡8喝9耍10髦 阅读(768) 评论(0) 推荐(0) 编辑

2018年10月25日

python快速抓取新闻标题及内容

摘要: from newspaper import Article url = '你想要爬取的网站url' news = Article(url, language='zh') news .download() #先下载 news .parse() #再解析 print(news.text) #新闻正文 p 阅读全文

posted @ 2018-10-25 20:17 泡8喝9耍10髦 阅读(1582) 评论(0) 推荐(0) 编辑

2018年10月22日

python爬虫第三方库

摘要: 通用 urllib -网络库(stdlib)。 requests -网络库。 grab – 网络库(基于pycurl)。 pycurl – 网络库(绑定libcurl)。 urllib3 – Python HTTP库,安全连接池、支持文件post、可用性高。 httplib2 – 网络库。 Robo 阅读全文

posted @ 2018-10-22 19:56 泡8喝9耍10髦 阅读(246) 评论(0) 推荐(0) 编辑

导航