上一页 1 2 3 4 5 6 7 8 9 10 ··· 40 下一页

2018年11月29日

摘要: 终端命令 1. 创建一个项目: scrapy startproject name 2. 利用蜘蛛名创建一个py文件: scrapy genspider name domain.name 3. 在终端运行:scrapy shell url 得到response 4. 利用蜘蛛名进行相对应的运行: sc 阅读全文
posted @ 2018-11-29 16:21 zengsf 阅读(473) 评论(0) 推荐(0) 编辑

2018年11月28日

摘要: from selenium import webdriver import selenium.webdriver.support.ui as ui import time opt = webdriver.ChromeOptions() # 无界面 opt.set_headless() # 设置分辨率 opt.add_argument("window-size=1900x3000") drive... 阅读全文
posted @ 2018-11-28 16:15 zengsf 阅读(207) 评论(0) 推荐(0) 编辑
摘要: 利用selenium来进行爬取数据 如果要用chrome浏览器的话,则将浏览器对象改为Chrome就可以 若要将有头浏览器变成无头浏览器的话,这添加 还有好多方法,查看文档即可:https://python-selenium-zh.readthedocs.io/zh_CN/latest/ 阅读全文
posted @ 2018-11-28 14:28 zengsf 阅读(372) 评论(0) 推荐(0) 编辑

2018年11月27日

摘要: 将爬取下来的内容保存到本地 阅读全文
posted @ 2018-11-27 20:23 zengsf 阅读(450) 评论(0) 推荐(0) 编辑
摘要: 将爬取出来的数据存入mongodb中 阅读全文
posted @ 2018-11-27 20:05 zengsf 阅读(108) 评论(0) 推荐(0) 编辑
摘要: 1、定义 自定义的urlopen()方法,urlopen()方法是一个特殊的opener(模块已定义好),不支持代理等功能,通过Handler处理器对象来自定义opener对象 2、常用方法 1、build_opener(Handler处理器对象) :创建opener对象 2、opener.open 阅读全文
posted @ 2018-11-27 09:21 zengsf 阅读(1074) 评论(0) 推荐(0) 编辑

2018年11月26日

摘要: 1.将爬取出来的数据存储到scv, mysql, mongo数据库中,利用正则的方式爬取。 得到csv中的结果,mysql和mongo结果就不显示了: 阅读全文
posted @ 2018-11-26 18:52 zengsf 阅读(199) 评论(0) 推荐(0) 编辑

2018年11月24日

摘要: 在flask中,肯定是post提交个from进行密码验证。还有一定就是修改密码肯定是登录之后才能进行对密码的修改,这么说,在浏览器中的session中一定会有用户的信息,可以通过相对应的信息去获取到相对应的用户密码。 这里需要对werkzeug库里面的两个方法有所了解: 数据库中直接存放明文密码是很 阅读全文
posted @ 2018-11-24 16:46 zengsf 阅读(905) 评论(0) 推荐(0) 编辑

2018年11月23日

摘要: import pymysql import warnings # 忽略警告 warnings.filterwarnings("ignore") # 连接数据库 db = pymysql.connect("localhost", 'root', "123456", charset="utf8") # 创建游标 cursor = db.cursor() # 创建数据库,如果存在,就不创建 c_... 阅读全文
posted @ 2018-11-23 17:11 zengsf 阅读(481) 评论(0) 推荐(0) 编辑
摘要: 得到结果: 阅读全文
posted @ 2018-11-23 14:15 zengsf 阅读(2050) 评论(0) 推荐(0) 编辑
上一页 1 2 3 4 5 6 7 8 9 10 ··· 40 下一页

导航