摘要: Handler处理器 和 自定义Opener opener是 urllib.request.OpenerDirector 的实例,之前使用的urlopen,是一个特殊的opener(模块帮我们构建好的)。 但是基本的urlopen()方法不支持代理、cookie等其他的HTTP/HTTPS高级功能。 阅读全文
posted @ 2018-09-10 20:25 凌晨四点的洛杉矶 阅读(136) 评论(0) 推荐(0) 编辑
摘要: urllib模块基本介绍   所谓网页抓取,就是把URL地址中指定的网络资源从网络流中读取出来,保存到本地。 在Python中有很多库可以用来抓取网页,我们先学习urllib。 urllib2 在 python3.x 中被改为urllib.request urlopen() &e 阅读全文
posted @ 2018-09-09 19:16 凌晨四点的洛杉矶 阅读(312) 评论(0) 推荐(0) 编辑
摘要: HTTP和HTTPS HTTP协议(HyperText Transfer Protocol,超文本传输协议):是一种发布和接收 HTML页面的方法。 HTTPS(Hypertext Transfer Protocol over Secure Socket Layer)简单讲是HTTP的安全版,在HT 阅读全文
posted @ 2018-09-08 10:11 凌晨四点的洛杉矶 阅读(397) 评论(0) 推荐(0) 编辑
摘要: 爬虫的定义 为什么要做爬虫 首先请问:都说现在是“大数据时代”,那数据从何而来? 企业产生的用户数据:百度指数、阿里指数、TBI腾讯浏览指数、新浪微博指数 数据平台购买数据:数据堂、国云数据市场、贵阳大数据交易所 . 政府/机构公开的数据:中华人民共和国国家统计局数据、世界银行公开数据、联合国数据、 阅读全文
posted @ 2018-09-06 21:37 凌晨四点的洛杉矶 阅读(297) 评论(0) 推荐(0) 编辑
摘要: 元类: Python中所有的东西——都是对象。这包括整数、字符串、函数以及类。它们全部都是对象,而且它们都是从一个类创建而来,这个类就是type 元类就是类的类,类作为一种对象,即可以在运行时动态的创建类: 1.在函数里创建类 2.使用type创建类 动态语言: 动态语言:可以在运行的过程中,修改代 阅读全文
posted @ 2018-09-05 17:25 凌晨四点的洛杉矶 阅读(189) 评论(0) 推荐(0) 编辑
摘要: 闭包 函数的引用 什么是闭包 运行结果 nonlocal global适用于函数内部修改全局变量的值 nonlocal适用于嵌套函数中内部函数修改外部变量的值 如果没有使用以上关键字,对全局变量或者外部变量进行修改,python会默认将全局变量隐藏起来 闭包的作用 函数line与变量a,b构成闭包。 阅读全文
posted @ 2018-09-05 14:56 凌晨四点的洛杉矶 阅读(100) 评论(0) 推荐(0) 编辑
摘要: 生成器: Python中,一边循环一边计算的机制,称为生成器:generator 创建生成器方法1 把一个列表生成式的 [ ] 改成 ( ) 访问生成器的元素: 调用next(G) 使用 for 循环,因为生成器也是可迭代对象 创建生成器方法2 通过函数实现 执行到yield时,fun函数作用暂时保 阅读全文
posted @ 2018-09-05 09:55 凌晨四点的洛杉矶 阅读(168) 评论(0) 推荐(0) 编辑
摘要: gogs简介 gogs是一款极易搭建的自助 Git 服务, 掌握了它, 我们就可以搭建自己的git服务站点 gogs官网: https://gogs.io/, github中文地址:https://github.com/gogs/gogs/blob/master/README_ZH.md 参考 ht 阅读全文
posted @ 2018-08-31 17:08 凌晨四点的洛杉矶 阅读(1155) 评论(0) 推荐(0) 编辑
摘要: 1. docker安装 2. 镜像 查找并下载镜像 镜像的操作 3. 容器 创建容器 启动停止,删除容器 查看容器运行情况 查看创建的容器的信息 向容器内部发送指令 4. 其他操作 容器和容器外拷贝文件 修改后的容器发布为镜像 私有仓库 下载仓库注册服务器的镜像,并创建出容器 本地镜像添加标签,并将 阅读全文
posted @ 2018-08-31 11:39 凌晨四点的洛杉矶 阅读(183) 评论(0) 推荐(0) 编辑