2017年7月6日

python之MySQL学习——数据查询

摘要: 1 import pymysql as ps 2 3 # 打开数据库连接 4 db = ps.connect(host='localhost', user='root', password='123456', database='test', charset='utf8') 5 6 # 创建一个游标对象 7 cur = db.cursor() 8 9 a = cur.ex... 阅读全文

posted @ 2017-07-06 15:49 小明在线 阅读(235) 评论(0) 推荐(0) 编辑

python框架Scrapy中crawlSpider的使用

摘要: 一、创建Scrapy工程 二、进入工程目录,根据爬虫模板生成爬虫文件 三、设置IP池或用户代理(middlewares.py文件) 四、settngs.py配置 五、定义爬取关注的数据(items.py文件) 六、爬虫文件编写(test.py) 七、管道文件编写(pipelines.py) 八、测试 阅读全文

posted @ 2017-07-06 13:51 小明在线 阅读(922) 评论(0) 推荐(0) 编辑

在Scrapy中使用IP池或用户代理更新版(python3)

摘要: middlewares.py settngs.py中添加一下代码(注意根据项目名修改指向,如这里的工程名是“的demo3”) 阅读全文

posted @ 2017-07-06 13:22 小明在线 阅读(2650) 评论(0) 推荐(0) 编辑

2017年7月5日

封装IP池和用户代理相应的类(python3)

摘要: 一、middlewares.py源代码: 二、settings.py文件设置,添加下面代码: 三、总结一些需要的东西 1.在引入(有关IP池有关的和关用户代理的)模块是注意这个 "contrib"不能丢了 2.配置下载中间件的连接信息时,注意文件指向,也就是调用类的指向 3.“.”表示这一级目录," 阅读全文

posted @ 2017-07-05 18:04 小明在线 阅读(545) 评论(0) 推荐(0) 编辑

在Scrapy中使用IP池或用户代理(python3)

摘要: 一、创建Scrapy工程 二、进入工程目录,根据爬虫模板生成爬虫文件 三、定义爬取关注的数据(items.py文件) 四、编写爬虫文件 五、设置IP池或用户代理 (1)设置IP池 步骤1:在settings.py文件中添加代理服务器的IP信息,如: 步骤2:创建下载中间文件middlewares.p 阅读全文

posted @ 2017-07-05 14:46 小明在线 阅读(15231) 评论(0) 推荐(0) 编辑

2017年7月4日

scrapy工程创建及pycharm运行

摘要: 1.通过命令行创建scrapy工程项目 scrapy startproject (工程名) 2.利用爬虫模板设置爬虫文件 在这个过程中我们可以先利用 scrapy genspider -l(小写的L)命令查看当前的爬虫模板 如:scrapy genspider -t 模板名 爬虫文件名 允许的域名 阅读全文

posted @ 2017-07-04 23:56 小明在线 阅读(735) 评论(0) 推荐(0) 编辑

python框架Scrapy报错TypeError: 'float' object is not iterable解决

摘要: 原因是:Twisted版本高了。 解决办法: 只要把Twisted库降级到16.6.0即可: 阅读全文

posted @ 2017-07-04 20:26 小明在线 阅读(9145) 评论(0) 推荐(0) 编辑

解决scrapy fetch http://www.csdn.net ModuleNotFoundError No module named 'win32api'和ImportError DLL load failed找不到指定的模块

摘要: 1.解决scrapy fetch http://www.csdn.netModuleNotFoundError No module named 'win32api' Python是没有自带访问windows系统API的库的,需要下载。库的名称叫pywin32,可以从网上直接下载。 以下链接地址可以下 阅读全文

posted @ 2017-07-04 13:36 小明在线 阅读(457) 评论(0) 推荐(0) 编辑

pip安装Scrapy框架报错

摘要: 安装: pip3 install scrapy==1.1.0rc3 一、.解决scrapy安装错误: 二、具体操作: 1.在http://landinghub.visualstudio.com/visual-cpp-build-tools下载相应的文件 点击下载,并安装即可 2.再次安装 pip3 阅读全文

posted @ 2017-07-04 10:25 小明在线 阅读(494) 评论(0) 推荐(0) 编辑

2017年7月3日

手动爬虫之糗事百科(ptyhon3)

摘要: 一、调用封装的Url_ProxyHelper类,源码如下 二、爬取源码 三、一点总结 1.关于urllib.request.urlopen("www.x.com").read()是否调用decode("utf-8")。答:一般而言,当我们抓取一个页面需要将该信息存档(如存为x.html文件)时,这个 阅读全文

posted @ 2017-07-03 17:29 小明在线 阅读(386) 评论(0) 推荐(0) 编辑

导航