摘要: 恢复内容开始 1.分布式爬虫 1.使用Selenium+Phantoms 登录 最重要的设置是User-Agent(UA),否则无法跳转链接 from selenium.webdriver.common.desired_capabilities(功能) import DesiredCapabilit 阅读全文
posted @ 2019-03-12 16:45 jacky912 阅读(313) 评论(0) 推荐(0) 编辑
摘要: 分布式爬虫 Xpath 正则表达式 动态网页 Headless的浏览器:phantomJS 浏览器的驱动:Selenium 1.Xpath 基本语法: 表达式:nodename(节点名) 选取此节点的所有子节点,tag或*选择任意的tag / 从根节点选取,选择直接子节点,不包含更小的后代(例如孙、 阅读全文
posted @ 2019-03-08 16:49 jacky912 阅读(472) 评论(0) 推荐(0) 编辑
摘要: 1.环境搭建-Python Unix 基础环境-Windows 1.pip,并设置pip源 1.直接下载Anaconda,很多比较难以安装的资源都已经包含了 配置pip conf,自动设置源 配置pip源,各个系统默认pip.ini位置不同,需要根据实际情况设置 #mkdir ~/.pip/ 官网: 阅读全文
posted @ 2019-03-08 14:31 jacky912 阅读(1474) 评论(0) 推荐(0) 编辑
摘要: 利用HTML5的一个formdata属性,结合jQuery可以很容易实现文件的上传,而且读取文件的上传进度。 注意:formdata属性必须依赖于HTML5,如果按照文本代码实现功能,则必须升级为最新属性(支持HTML5formdata属性) 为了避免页面整体刷新,我们还可以采用ajax+ifram 阅读全文
posted @ 2019-03-07 17:10 jacky912 阅读(238) 评论(0) 推荐(0) 编辑
摘要: form表单是页面与web服务器交互过程中最重要的信息来源。 表单提交成功控件 浏览器是如何提交表单的?或者说浏览器在提交表单时需要做哪些事情? 浏览器并不是将所有的表单控件全部发送到服务器的,而是会查找所有的【成功控件】,只将这些成功控件的数据发送到服务端。(成功控件:每个表单中的属性都有一个na 阅读全文
posted @ 2019-03-06 17:11 jacky912 阅读(394) 评论(0) 推荐(0) 编辑
摘要: session 在web中,还经常使用session来记录客户端状态。session是服务器端使用的一种记录客户端状态的机制,使用要比cookie简单一些,相应的也增加了服务器的存储压力。 1.什么是session? session是另一种记录客户端状态的机制。不同的是cookie保存在客户端浏览器 阅读全文
posted @ 2019-03-04 15:08 jacky912 阅读(345) 评论(0) 推荐(0) 编辑
摘要: 会话(session)跟踪是web程序中常用技术,用来跟踪用户的整个会话。常用的会话跟踪技术有cookie和session。cookie通过在客户端记录信息确定用户身份,session通过服务器端记录信息确定用户身份。 1.cookie机制 在程序中会话跟踪技术是非常重要的。理论上,一个用户所有请求 阅读全文
posted @ 2019-03-04 14:23 jacky912 阅读(400) 评论(0) 推荐(0) 编辑
摘要: 1.同源策略 指浏览器对不同源的脚本或者文本的访问方式进行的限制。比如源a的js不能引入源b的元素属性。 所谓的同源是指两个页面具有相同的协议、主机(也是常说的域名)、端口,三个元素缺一不可。 通过下列示例具体了解一下同源: 同源策略限制了不同源之间的交互,(同源策略限制了不同源之间的交互主要针对j 阅读全文
posted @ 2019-03-04 11:27 jacky912 阅读(552) 评论(0) 推荐(0) 编辑
摘要: 中间件(middleware) 在Django中,中间件其实就是一个类。在请求到来和结束后,Django会根据自己的规则在合适的时机执行中间件中相应的方法。 在Django项目的settings模块中,有一个 MIDDLEWARE_CLASSES 变量,其中每一个元素就是一个中间件,如下图。 与ma 阅读全文
posted @ 2019-03-01 10:53 jacky912 阅读(166) 评论(0) 推荐(0) 编辑
摘要: ajax的储备知识 1.什么是ajax? json是指JavaScript对象表示法(JavaScript object natation) json是轻量级的文本数据交换格式 json独立于语言 json具有语言描述性 json使用JavaScript语法来描述数据对象,但是json仍然独立于语言 阅读全文
posted @ 2019-02-28 16:33 jacky912 阅读(115) 评论(0) 推荐(0) 编辑