10 2018 档案
摘要:电脑同时装了python2和python3,并且都配置了环境变量 将python2的python.exe改成python2.exe,python3的python.exe没有改(主要用python2时则可改python3的exe) 命令行里输入python,python2会进入对应的python版本
阅读全文
摘要:Linux安装 VMware tools 工具解决复制和粘贴的方法 VMware虚拟机中如何安装VMWare-Tools详解好处:可以支持图形界面,可以支持共享文件功能等 1 工具/原料 1)安装过虚拟机软件的计算机 2)linux >Ubuntu 16.04操作系统 三行命令搞定Ubuntu 16
阅读全文
摘要:Gerapy 基于Scrapy,Scrapyd,Scrapyd-Client,Scrapyd-API,Django和Vue.js的分布式爬虫管理框架。 支持 Gerapy是在Python 3.x上开发的。稍后将支持Python 2.x. 用法 通过pip安装Gerapy: pip3 install
阅读全文
摘要:1、背景 验证码自动识别在模拟登陆上使用的较为广泛,一直有耳闻好多人在使用机器学习来识别验证码,最近因为刚好接触这方面的知识,所以特定研究了一番。发现网上已有很多基于machine learning的验证码识别,本文主要参考几位大牛的研究成果,集合自己的需求,进行改进、学习。 2、基本工具 开发环境
阅读全文
摘要:我有一个Android客户端应用程序尝试使用Django + DRF后端进行身份验证。但是,当我尝试登录时,我收到以下响应: 该请求将发送给http://localhost/rest-auth/google/以下机构: 什么可能导致这个?客户端没有CSRF令牌,因为要进行身份验证的POST是客户端和
阅读全文
摘要:本文介绍Navicat Premium 12.1.8.0的安装、激活与基本使用。 博主所提供的激活文件理论支持Navicat Premium 12.0.x系列和Navicat Premium 12.1.x系列的注册机。由于本文一直在更新,Navicat Premium 12.0.x系列全部都是可以成
阅读全文
摘要:Requests+正则表达式爬取猫眼TOP100榜电影信息 MARK:将信息写入文件解决乱码方法,开启进程池秒爬。 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34
阅读全文
摘要:Requests基于urllib3比urllib更简单方便。 基本的GET请求 1 2 3 4 import requests response = requests.get('http://httpbin.org/get') print(response.text) 1 2 3 4 import
阅读全文
摘要:PyQuery 是 Python 仿照 jQuery 的严格实现。语法与 jQuery 几乎完全相同。 PyQuery 是 Python 仿照 jQuery 的严格实现。语法与 jQuery 几乎完全相同。 官方文档:http://pyquery.readthedocs.io/ 安装 1 pip i
阅读全文
摘要:在线正则表达式测试 http://tool.oschina.net/regex/ 常见匹配模式 re.match re.match 尝试从字符串的起始位置匹配一个模式,如果不是起始位置匹配成功的话,match()就返回none。 1 re.match(pattern, string, flags=0
阅读全文
摘要:xpath简介 1.xpath使用路径表达式在xml和html中进行导航 2.xpath包含标准函数库 3.xpath是一个w3c的标准 xpath节点关系 1.父节点 2.子节点 3.同胞节点 4.先辈节点 5.后代节点 xpath语法
阅读全文
摘要:原文来自:https://www.cnblogs.com/0bug/p/8893677.html 原文来自:https://www.cnblogs.com/0bug/p/8893677.html 什么是Urllib? Python内置的HTTP请求库 urllib.request 请求模块 urll
阅读全文
摘要:常见的User-Agent 1.Android Mozilla/5.0 (Linux; Android 4.1.1; Nexus 7 Build/JRO03D) AppleWebKit/535.19 (KHTML, like Gecko) Chrome/18.0.1025.166 Safari/53
阅读全文
摘要:GET和POST是HTTP请求的两种基本方法,要说它们的区别,接触过WEB开发的人都能说出一二。 最直观的区别就是GET把参数包含在URL中,POST通过request body传递参数。 你可能自己写过无数个GET和POST请求,或者已经看过很多权威网站总结出的他们的区别,你非常清楚知道什么时候该
阅读全文
摘要:阅读目录 http的请求部分 常用请头信息 常用响应头信息 阅读目录 http的请求部分 常用请头信息 常用响应头信息 http的请求部分 基本结构 常用请头信息 Accept:text/html,image/*(告诉服务器,浏览器可以接受文本,网页图片) Accept-Charaset:ISO-8
阅读全文
摘要:什么是爬⾍ 请求⽹网站并提取数据的⾃自动化程序 爬虫的基本流程 发起请求 通过HTTP库向⽬目标站点发起请求,即发送⼀个Request,请求可以包含额外的headers等信息,等待服务器响应。 获取相应内容 如果服务器器能正常响应,会得到⼀一个Response,Response的内容便是所要获取的⻚
阅读全文
摘要:爬虫是什么 什么是互联网 互联网是由网络设备(网线,路由器,交换机,防火墙等等)和一台台计算机连接而成,像一张网一样。 互联网建立的目的 互联网的核心价值在于数据的共享/传递:数据是存放于一台台计算机上的,而将计算机互联到一起的目的就是为了能够方便彼此之间的数据共享/传递,否则你只能拿U 盘去别人的
阅读全文
摘要:第一步:在项目目录下的settings.py中MIDDLEWARE中加上中间件: # session中间件Django项目默认启用Session 'django.contrib.sessions.middleware.SessionMiddleware', 第二步:在redis中保存session,
阅读全文
摘要:第一步:配置 1.在工程中创建模板目录templates。 2.在settings.py配置文件中修改TEMPLATES配置项的DIRS值:TEMPLATES = [ { 'BACKEND': 'django.template.backends.django.DjangoTemplates', 'D
阅读全文
摘要:创建虚拟环境 注意需要联网 安装Django 使用django 1.11.11版本,注意需要联网 复习虚拟环境和pip的命令 创建工程 创建工程的命令为: 与项目同名的目录,此处为demo。 settings.py 是项目的整体配置文件。 urls.py 是项目的URL配置文件。 wsgi.py 是
阅读全文
摘要:CSRF 保护 这部分文档介绍了 CSRF 保护。 为什么需要 CSRF? Flask-WTF 表单保护你免受 CSRF 威胁,你不需要有任何担心。尽管如此,如果你有不包含表单的视图,那么它们仍需要保护。 例如,由 AJAX 发送的 POST 请求,然而它背后并没有表单。在 Flask-WTF 0.
阅读全文
摘要:1. SQLalchemy简介 SQLAlchemy是一个开源的SQL工具包,基本Python编程语言的MIT许可证而发布的对象关系映射器。SQLAlchemy提供了“一个熟知的企业级全套持久性模式, 专为高效率和高性能的数据库访问而设计“。SQLAlchemy的首次发布2006年2月,并已迅速成为
阅读全文