摘要: 我的版本是14.04 1.更新系统 ##如果系统没有换国内下载路径需要换下系统的更新下载路径 http://www.cnblogs.com/seablog/p/7043798.html sudo apt-get update 更新系统 sudo apt-get upgrade 2.安装pip scr 阅读全文
posted @ 2017-06-12 17:17 sea101 阅读(321) 评论(0) 推荐(0) 编辑
摘要: 在spider中最后一个函数返回item时会scrapy会调用pipeline里面的 阅读全文
posted @ 2017-06-12 17:15 sea101 阅读(476) 评论(0) 推荐(1) 编辑
摘要: scrapy stratproject projectname ##创建一个项目 scrapy genspider myspidername fider ##创建一个spider文件 scrapy crawl spidername ## 执行一个spider程序 scrapy shell url # 阅读全文
posted @ 2017-06-12 16:50 sea101 阅读(279) 评论(0) 推荐(1) 编辑
摘要: python的正则是通过re模块的支持 匹配的3个函数 match :只从字符串的开始与正则表达式匹配,匹配成功返回matchobject,否则返回none; re.match(pattern, string, flags=0) ##flags标志位,用于控制正则表达式的匹配方式,如:是否区分大小写 阅读全文
posted @ 2017-06-12 16:10 sea101 阅读(233) 评论(0) 推荐(1) 编辑