zengsf

scrapy常用命令

摘要：终端命令 1. 创建一个项目: scrapy startproject name 2. 利用蜘蛛名创建一个py文件: scrapy genspider name domain.name 3. 在终端运行：scrapy shell url 得到response 4. 利用蜘蛛名进行相对应的运行: sc 阅读全文

posted @ 2018-11-29 16:21 zengsf 阅读(484) 评论(0) 推荐(0)

利用selenium模拟登录webqq

摘要： from selenium import webdriver import selenium.webdriver.support.ui as ui import time opt = webdriver.ChromeOptions() # 无界面 opt.set_headless() # 设置分辨率 opt.add_argument("window-size=1900x3000") drive... 阅读全文

posted @ 2018-11-28 16:15 zengsf 阅读(210) 评论(0) 推荐(0)

selenium和PhantomJS的使用

摘要：利用selenium来进行爬取数据如果要用chrome浏览器的话，则将浏览器对象改为Chrome就可以若要将有头浏览器变成无头浏览器的话，这添加还有好多方法，查看文档即可：https://python-selenium-zh.readthedocs.io/zh_CN/latest/ 阅读全文

posted @ 2018-11-28 14:28 zengsf 阅读(372) 评论(0) 推荐(0)

爬取百度贴吧中的图片以及视频

摘要：将爬取下来的内容保存到本地阅读全文

posted @ 2018-11-27 20:23 zengsf 阅读(454) 评论(0) 推荐(0)

爬取糗事百科中的数据

摘要：将爬取出来的数据存入mongodb中阅读全文

posted @ 2018-11-27 20:05 zengsf 阅读(108) 评论(0) 推荐(0)

urllib.request中Handler处理器

摘要： 1、定义自定义的urlopen()方法,urlopen()方法是一个特殊的opener(模块已定义好),不支持代理等功能,通过Handler处理器对象来自定义opener对象 2、常用方法 1、build_opener(Handler处理器对象) ：创建opener对象 2、opener.open 阅读全文

posted @ 2018-11-27 09:21 zengsf 阅读(1078) 评论(0) 推荐(0)

爬取链家二手房

摘要： 1.将爬取出来的数据存储到scv， mysql， mongo数据库中，利用正则的方式爬取。得到csv中的结果，mysql和mongo结果就不显示了：阅读全文

posted @ 2018-11-26 18:52 zengsf 阅读(202) 评论(0) 推荐(0)

flask中利用from来进行对修改修改时旧密码的验证

摘要：在flask中，肯定是post提交个from进行密码验证。还有一定就是修改密码肯定是登录之后才能进行对密码的修改，这么说，在浏览器中的session中一定会有用户的信息，可以通过相对应的信息去获取到相对应的用户密码。这里需要对werkzeug库里面的两个方法有所了解：数据库中直接存放明文密码是很阅读全文

posted @ 2018-11-24 16:46 zengsf 阅读(909) 评论(0) 推荐(0)

将数据存入mysql中

摘要： import pymysql import warnings # 忽略警告 warnings.filterwarnings("ignore") # 连接数据库 db = pymysql.connect("localhost", 'root', "123456", charset="utf8") # 创建游标 cursor = db.cursor() # 创建数据库，如果存在，就不创建 c_... 阅读全文

posted @ 2018-11-23 17:11 zengsf 阅读(485) 评论(0) 推荐(0)

python中把数据存入csv中

摘要：得到结果：阅读全文

posted @ 2018-11-23 14:15 zengsf 阅读(2052) 评论(0) 推荐(0)

导航