摘要: 一、基础 1)反爬:useragent/cookie/代理ip/js生成/需要登陆/refer/2)url得到方式:network/search3)提取方式:正则/xpath/bs4/josn/jsonpath/css4)验证码处理:手动/打码平台/tesseract识别5)数据去重:数据库分组去重 阅读全文
posted @ 2019-01-11 20:40 何以解忧唯有杜康 阅读(212) 评论(0) 推荐(0) 编辑
摘要: 一、项目开始 django-admin startproject fresh(项目名) python manage.py startapp user(应用名) 1)添加应用 在ALLOWED_HOSTS中添加app 2)设置可以访问的IP 在ALLOWED_HOSTS中设置 3)设置模版(TEMPL 阅读全文
posted @ 2019-01-11 20:28 何以解忧唯有杜康 阅读(3318) 评论(0) 推荐(0) 编辑
摘要: 1.创建python环境 python –V 查看python版本 which python 查看当前路径 进入当前路径/usr/bin apt update 更新apt apt-get install python3-pip 更新pip ln –s python3 python 创建软连接 2.安 阅读全文
posted @ 2019-01-11 20:22 何以解忧唯有杜康 阅读(6509) 评论(0) 推荐(0) 编辑