06 2018 档案

摘要:1 绘制条形图 2 绘制智联招聘职位岗位数量图 3 词云 “词云”这个概念由美国西北大学新闻学副教授、新媒体专业主任里奇·戈登(Rich Gordon)提出。“词云”就是对网络文本中出现频率较高的“关键词”予以视觉上的突出,形成“关键词云层”或“关键词渲染”,从而过滤掉大量的文本信息,使浏览网页者只 阅读全文
posted @ 2018-06-30 10:07 诚实善良小郎君 阅读(713) 评论(0) 推荐(0)
摘要:(1)字符串反转 1倒序输出 2 列表reverse()操作 3 二分法交换位置 4 列表生成式 5 栈的思想 6 递归的思路 (2)冒泡排序 采用循环 采用数组中的partition,用递归实现 传入的第一个参数是 ,即函数对象本身。由于结果 是一个 ,`Iterator list()`函数让它把 阅读全文
posted @ 2018-06-29 08:51 诚实善良小郎君 阅读(378) 评论(0) 推荐(0)
摘要:1 jsonPath数据格式 pip安装: pip install jsonpath 用来解析json格式的字符串,类似于xpath (1) json对象的转换 (2) XPath与jsonPath格式对比 | XPath | JSONPath | Description | | | | | | / 阅读全文
posted @ 2018-06-28 20:54 诚实善良小郎君 阅读(365) 评论(0) 推荐(0)
摘要:爬虫入门之爬取策略 XPath与bs4实现(五) 在爬虫系统中,待抓取URL队列是很重要的一部分。待抓取URL队列中的URL以什么样的顺序排列也是一个很重要的问题,因为这涉及到先抓取那个页面,后抓取哪个页面。而决定这些URL排列顺序的方法,叫做抓取策略。下面重点介绍几种常见的抓取策略: 1 深度优先 阅读全文
posted @ 2018-06-27 21:08 诚实善良小郎君 阅读(801) 评论(1) 推荐(0)
摘要:1 Requests模块解析 Requests 唯一的一个非转基因的 Python HTTP 库,人类可以安全享用 Requests 继承了urllib2的所有特性。Requests支持HTTP连接保持和连接池,支持使用cookie保持会话,支持文件上传,支持自动确定响应内容的编码,支持国际化的 U 阅读全文
posted @ 2018-06-27 09:32 诚实善良小郎君 阅读(497) 评论(0) 推荐(1)
摘要:1 自定义opener opener是 urllib.request.OpenerDirector 的实例,我们之前一直都在使用的urlopen,它是一个特殊的模块构建好的opener 但是基本的urlopen()方法 不支持代理、cookie等其他的HTTP/HTTPS高级功能 。所以要支持这些功 阅读全文
posted @ 2018-06-25 19:23 诚实善良小郎君 阅读(762) 评论(0) 推荐(0)
摘要:1 下载与解压 2 移动安装文件 3 添加环境变量 4 添加配置文件 5 创建目录文件 6 编辑启动项下的文件 python sudo vim /etc/init.d/mongodb 执行的脚本 !/bin/sh BEGIN INIT INFO Provides: mongodb Required 阅读全文
posted @ 2018-06-24 18:20 诚实善良小郎君 阅读(325) 评论(0) 推荐(0)
摘要:nginx静态文件配置 nginx + 反向代理 + runserver nginx + uwsgi启动 nginx + 负载均衡 阅读全文
posted @ 2018-06-24 10:58 诚实善良小郎君 阅读(316) 评论(0) 推荐(0)
摘要:1 select poll epoll的区别 基本上select有3个缺点: 1. 连接数受限 2. 查找配对速度慢 3. 数据由内核拷贝到用户态 poll改善了第一个缺点 epoll改了三个缺点. (1)select,poll实现需要自己不断轮询所有fd集合,直到设备就绪,期间可能要睡眠和唤醒多次 阅读全文
posted @ 2018-06-24 10:52 诚实善良小郎君 阅读(416) 评论(0) 推荐(0)
摘要:爬虫入门之urllib库详解(二) 1 urllib模块 2 urllib读取网页的三种方式 urlopen直接打开 采用User Agent (用户代理,简称UA) 定制header信息 在 HTTP Request 中加入特定的 Header,来构造一个完整的HTTP请求消息。 可以通过调用Re 阅读全文
posted @ 2018-06-22 14:25 诚实善良小郎君 阅读(504) 评论(0) 推荐(0)
摘要:1 python拷贝 深拷贝,浅拷贝 与引用三者的区别 2 python的垃圾回收机制 Python GC主要使用引用计数(reference counting)来跟踪和回收垃圾。在引用计数的基础上,通过“标记 清除”(mark and sweep)解决容器对象可能产生的循环引用问题,通过“分代回收 阅读全文
posted @ 2018-06-21 08:40 诚实善良小郎君 阅读(291) 评论(2) 推荐(0)
摘要:1 爬虫概述 (1)互联网爬虫 (2)核心任务 (3)爬虫语言 (4)爬虫分类 (5)整体框架 2 http协议 (1)常见端口 (2) http工作原理 (3) http常见的状态码 3 抓包工具fiddler (1) 配置https (2) Web Session 面板 主要是Fiddler抓取 阅读全文
posted @ 2018-06-20 20:00 诚实善良小郎君 阅读(542) 评论(0) 推荐(0)
摘要:Python 进程线程协程 GIL 闭包 与高阶函数(五) 1 GIL线程全局锁 ​ 线程全局锁(Global Interpreter Lock),即Python为了保证线程安全而采取的独立线程运行的限制,说白了就是一个核只能在同一时间运行一个线程. 对于io密集型任务,python的多线程起到作用 阅读全文
posted @ 2018-06-20 08:35 诚实善良小郎君 阅读(296) 评论(1) 推荐(0)
摘要:1 新式类与旧式类 新式类拥有经典类的全部特性之外,还有一些新的特性,比如 发生变化,新增了静态方法 ,python3目前都采用新式类,新式类是广度优先,旧式类是深度优先 (1)内置的object对象 (2)类的方法 静态方法 类方法 新式类(new style class) : 类的初始化方法 静 阅读全文
posted @ 2018-06-18 21:53 诚实善良小郎君 阅读(327) 评论(0) 推荐(0)
摘要:1 可变长参数与关键字参数 代表任意长度可变参数 代表关键字参数 用 和` kwargs`只是为了方便并没有强制使用它们. 缺省参数 即是调用该函数时, 缺省参数的值若未被传入,则传入默认预设的值 。 注意 : 须将所有带有默认值的参数置于参数列表的 末尾 。 当你不确定你的函数里将要传递多少参数时 阅读全文
posted @ 2018-06-17 22:17 诚实善良小郎君 阅读(457) 评论(0) 推荐(0)
摘要:1 概述 2 ORM 3 定义属性 4 创建模型类: 元选项 5 类属性 6 创建对象 7 模型查询 8 字段查询 9 聚合函数 阅读全文
posted @ 2018-06-17 15:25 诚实善良小郎君 阅读(287) 评论(0) 推荐(0)
摘要:1 总体结构 ​ Django是MTV结构,即:Model, Template, View Model:定义数据的存储格式,并且提供了数据库访问的API。 View:定义那些数据被显示,是业务逻辑处理模块。 Template:定义数据如何被显示。 Django工程包含工程的配置、及多个APP,每个A 阅读全文
posted @ 2018-06-16 09:41 诚实善良小郎君 阅读(360) 评论(0) 推荐(0)
摘要:1 视图views概述 2 django访问过程 3 URL配置 4 视图函数 5 HttpResquest对象 6 HttpResponse对象 7 session状态保持 8 注意事项 阅读全文
posted @ 2018-06-14 22:41 诚实善良小郎君 阅读(227) 评论(0) 推荐(0)
摘要:1 搭建环境 2 创建项目及数据库 3 创建App运用并配置 4 设计model表结构 5 执行迁移文件 6 启动django服务器 7 对数据库简单的操作 8 创建模板templates 9 app下添加子路由urls.py 10 关联表查询 当然上述过程只适合新手理清楚django整体的项目流程 阅读全文
posted @ 2018-06-13 22:56 诚实善良小郎君 阅读(408) 评论(0) 推荐(0)
摘要:1 python自省机制 这个是python一大特性,自省就是面向对象的语言所写的程序在运行时,能知道对象的类型,换句话说就是在运行时能获取对象的类型,比如通过 type(),dir(),getattr(),hasattr(),isinstance(). 2 python中列表推导式,字典推导式,集 阅读全文
posted @ 2018-06-11 21:56 诚实善良小郎君 阅读(231) 评论(0) 推荐(0)
摘要:1 Python的函数传递: 首先所有的变量都可以理解为内存中一个对象的‘引用’ 可以看到,在执行完 之后, 引用中保存的值,即内存地址发生变化,由原来 对象的所在的地址变成了 这个实体对象的内存地址。下面我们来看另一个例子: 注意: 1. 类型是属于对象的,而不是变量。而对象有两种,“可更改”(m 阅读全文
posted @ 2018-06-10 22:52 诚实善良小郎君 阅读(7467) 评论(4) 推荐(0)
摘要:1 文件系统 2 forms目录下 3 models目录下 3 views目录 4 APP应用下 html页面的代码比较多,有需要的可以访问源码地址,感谢阅读!! GitHub源码地址:https://github.com/whyjust/blog 阅读全文
posted @ 2018-06-10 19:09 诚实善良小郎君 阅读(504) 评论(0) 推荐(0)
摘要:(1) github项目搭建 1 连接GitHub 2 配置git 3 配置虚拟环境 4 安装flask 5 创建github项目 (2) 项目简单流程 1 项目配置文件config.py/settings.py 2 创建主启动文件manage.py ​ 该文件是 Flask 应用的核心,也是程序的 阅读全文
posted @ 2018-06-09 12:26 诚实善良小郎君 阅读(732) 评论(0) 推荐(0)
摘要:1 一对多(One To Many) 表示一对多的关系时,在子表类 Post 中需要通过 foreign key (外键)引用父表类 User 在Post类中指定ForeignKey: user_id 字段是 posts 表的外键,代表了外键约束。强制规定了字段 user_id 的值必须同时存在于U 阅读全文
posted @ 2018-06-08 11:02 诚实善良小郎君 阅读(726) 评论(0) 推荐(0)
摘要:1 查询集 : 指数据查询的集合 1. 原始查询集: 不经过任何过滤返回的结果为原始查询集 2. 数据查询集: 将原始查询集经过条件的筛选最终返回的结果 查询过滤器: | 过滤器 | 功能 | | | | | cls.query.filter(类名.属性名 条件操作符 条件) | 过滤特定条件,返回 阅读全文
posted @ 2018-06-07 15:49 诚实善良小郎君 阅读(2386) 评论(0) 推荐(0)
摘要:​ Web程序开发中最重要的莫过于关系型数据库,即SQL 数据库,另外文档数据库(如 mongodb)、键值对数据库(如 redis)慢慢变得流行. 原因 : 我们不直接使用这些数据库引擎提供的 Python 包,而是使用对象关系映射(Object Relational Mapper, ORM)框架 阅读全文
posted @ 2018-06-05 08:56 诚实善良小郎君 阅读(2300) 评论(0) 推荐(0)
摘要:​ 应用场景: 用户在注册或者密码丢失等过程中,账号绑定邮箱,用户在进行身份认证的过程中,电子邮箱确实是一种很常用的方式,Python中提供了smtplib可以实现发送电子邮件功能,Flask框架也有对应的flask email库,扩展对电子发送的支持 安装 导入及初始化 Flask mail可以连 阅读全文
posted @ 2018-06-04 21:36 诚实善良小郎君 阅读(490) 评论(0) 推荐(0)
摘要:1 视图传递多个参数 (1) 普通传参 : 关键字参数传递 (2) 字典传参 : 以字典的形式传递 (3) 全局变量g传递 视图中: 模板中 (4) 传递全部的本地变量给template,使用 locals() ,直接获取变量值 test.html中 2 错误页面定制 指定错误页面:只需要一个错误模 阅读全文
posted @ 2018-06-03 22:31 诚实善良小郎君 阅读(1579) 评论(0) 推荐(0)
摘要:(1) 原生的表单 模板页面,form表单 在manage.py中 在manage.py中将路由函数合并 (2) Flask wtf表单 说明 : 是一个用于表单处理,校验并提供csrf验证的功能的扩展库 安装 : 作用: Flask wtf能保护所有表单免受跨站请求伪造的攻击(Cross Site 阅读全文
posted @ 2018-06-02 17:37 诚实善良小郎君 阅读(6299) 评论(0) 推荐(0)
摘要:1 模板包含include 主体结构 (导入整个模板,直接渲染不可修改) {% include('模板名称') %} {% include('目录/模板名称') %} 功能: 其功能就是将另一个模板加载到当前模板中,并直接渲染在当前位置上,而且是一次渲染整个模块内容 注意: 当include模板文件 阅读全文
posted @ 2018-06-01 20:00 诚实善良小郎君 阅读(491) 评论(0) 推荐(0)