摘要: 1. python在控制台中查看文檔 2. pydoc生成HTML文檔 3. 啓動本地服務器來查看文檔信息 4. pydoc查找模塊 阅读全文
posted @ 2019-08-12 10:11 RiocasTure 阅读(103) 评论(0) 推荐(0) 编辑
摘要: 1. IP地址驗證 背景:有些網站會使用IP地址驗證進行反爬蟲處理,檢查客戶端的IP地址,若同一個IP地址頻繁訪問,則會判斷該客戶端是爬蟲程序。 解決方案: 1. 讓Scrapy不斷隨機更換代理服務器的IP地址,如在middlewares.py中添加如下類: 2.在setting.py中啓用自定義m 阅读全文
posted @ 2019-08-12 09:35 RiocasTure 阅读(158) 评论(0) 推荐(0) 编辑
摘要: 1. Spider程序: 2. 在Pipeline中使用urllib.request包直接下載圖片: 阅读全文
posted @ 2019-08-12 09:05 RiocasTure 阅读(171) 评论(0) 推荐(0) 编辑
摘要: Scrapy——將數據保存到MySQL數據庫 1. 在MySQL中創建數據庫表job_inf: 2. 在scrapy項目中將Pipeline文件修改如下: 阅读全文
posted @ 2019-08-12 08:53 RiocasTure 阅读(113) 评论(0) 推荐(0) 编辑